این کاملترین دوره آموزشی تقویتی در Udemy است. در آن شما اصول یادگیری تقویتی، یکی از سه پارادایم هوش مصنوعی مدرن را خواهید آموخت. شما از ابتدا الگوریتم های تطبیقی را پیاده سازی خواهید کرد که وظایف کنترلی را بر اساس تجربه حل می کنند. همچنین خواهید آموخت که این الگوریتمها را با تکنیکهای یادگیری عمیق و شبکههای عصبی ترکیب کنید و شاخهای به نام یادگیری تقویتی عمیق را ایجاد کنید.
این دوره پایه و اساس لازم را در اختیار شما قرار می دهد تا بتوانید الگوریتم های جدید را در زمان ظهور درک کنید. همچنین شما را برای دورههای بعدی این مجموعه آماده میکند، که در آن به شاخههای مختلف یادگیری تقویتی عمیقتر خواهیم رفت و به برخی از الگوریتمهای پیشرفتهتر موجود نگاه خواهیم کرد.
این دوره بر توسعه مهارت های عملی متمرکز است. بنابراین، پس از یادگیری مهمترین مفاهیم هر خانواده از روشها، یک یا چند الگوریتم آنها را از ابتدا در نوتبوکهای jupyter پیادهسازی میکنیم.
این دوره به سه بخش تقسیم می شود و موضوعات زیر را پوشش می دهد:
بخش 1 (روش های جدولی):
- فرآیند تصمیم گیری مارکوف
- برنامه نویسی پویا
- روشهای مونت کارلو
- روشهای اختلاف زمانی (SARSA، Q-Learning)
- راهاندازی N مرحلهای
قسمت 2 (فضاهای حالت پیوسته):
- تجمع حالت
- کدگذاری کاشی
بخش 3 (یادگیری تقویتی عمیق):
- SARSA عمیق
- یادگیری عمیق Q
- تقویت
- Advantage Actor-Critic/A2C (Advantage Actor-Critic/روش A2C)
دوره های عملی و جامع هوش مصنوعی
Escape Velocity Labsدوره های عملی و جامع هوش مصنوعی
نمایش نظرات