یک بررسی مقدماتی از یادگیری عمیق برای مدلهای پیش بینی با دادههای بزرگ
چکیده مقاله
مدلهای یادگیریعمیق ارائه دهنده یک الگوی جدید از یادگیری در هوش مصنوعی (AI) و یادگیری ماشین هستند. نتایج موفقیت آمیز اخیر در تجزیه و تحلیل تصویر و تشخیص گفتار ، علاقه چشمگیری در این شاخه علمی ایجاد کرده است ؛ چرا که امکان به کارگیری یادگیری عمیق در بسیاری از حوزههای دیگر که با دادههای بزرگ سر و کار دارند ، وجود دارد. از معایب یادگیری عمیق ، بخصوص برای دانشمندان میان رشته ای ، محاسبات و ریاضیات پیچیده ای است که در مدلهای یادگیری عمیق وجود دارد.
به همین دلیل ، در این مقاله یک مرور کلی به رویکردهای یادگیری عمیق شامل شبکههای عصبی پیشخور (D-FFNN) ، شبکههای عصبی کانولوشن (CNNs) ، شبکه باور عمیق (DBNs) ، خودرمزگذارها (AEs) ، حافظه طولانی کوتاه-مدت (LSTM) خواهیم داشت. این مدلها اصلی ترین مدلها در معماری یادگیری عمیق هستند که در حال حاضر استفاده می شوند و باید در جعبه ابزار هر دانشمند علم داده قرار داشته باشند. نکته مهم ، بلوکهای اصلی سازنده معماری می توانند به صورت انعطاف پذیری ترکیب شوند تا معماریهای شبکه برای کاربردهای خاص نیز ساخته شود. از این رو ، درک معماریهای این شبکهها دارای اهمیت است تا برای تحولات آینده در هوش مصنوعی آماده شویم.
فهرست مطالب
1-مقدمه
2- تحولات اساسی در شبکههای عصبی: تاریخچه زمانی
3. معماری شبکههای عصبی
3.1 مدل نورون مصنوعی
3.2 شبکههای عصبی پیشرو ( FFNN)
3-3. شبکههای عصبی بازگشتی (RNN)
3.3.1. شبکههاپفیلد
3.3.2. ماشین بولتزمن
3.4 مروری بر معماری شبکه
4. شبکههای عصبی پیشرو عمیق
5. شبکههای عصبی کانولوشن
5.1 بخشهای اصلی شبکه عصبی کانولوشن ( CNN)
5.2 مهمترین انوع شبکههای عصبی کانولوشن
6. شبکههای باور عمیق
6.1 مرحله قبل از آموزش: بدون نظارت
6.2 مرحله تنظیم دقیق: تحت نظارت
7. خودرمزگذار
8. شبکههای حافظه طولانی کوتاه مدت
8.1 ساختار شبکه LSTM با گیت فراموش کننده
8.2 شبکه عصبی حافظه کوتاه مدت Peephole
8.3 برنامههای کاربردی
9. بحث و گفتگو
9.1 خصوصیات عمومی یادگیری عمیق
9.2 تفاوت بین مدلها
9.3 مدلهای قابل تفسیر در مقابل مدلهای جعبه سیاه
9.4 دادههای بزرگ در مقابل دادههای کوچک
9.5 انواع دادهها
9.6 مدلهای پیشرفته بیشتر
10. نتیجه گیری
دیدگاهتان را بنویسید