این کاملترین دوره آموزش تقویتی پیشرفته در Udemy است. در آن، پیاده سازی برخی از قدرتمندترین الگوریتم های یادگیری تقویتی عمیق در پایتون را با استفاده از PyTorch و PyTorch Lightning خواهید آموخت. شما از ابتدا الگوریتم های تطبیقی را پیاده سازی خواهید کرد که وظایف کنترلی را بر اساس تجربه حل می کنند. شما یاد خواهید گرفت که این تکنیک ها را با شبکه های عصبی و روش های یادگیری عمیق ترکیب کنید تا عوامل هوش مصنوعی تطبیقی ایجاد کنید که قادر به حل وظایف تصمیم گیری هستند.
این دوره شما را با آخرین هنر در تکنیک های یادگیری تقویتی آشنا می کند. همچنین شما را برای دورههای بعدی این مجموعه آماده میکند، جایی که ما روشهای پیشرفته دیگری را که در انواع دیگر وظایف برتر هستند، بررسی خواهیم کرد.
این دوره بر توسعه مهارت های عملی متمرکز است. بنابراین، پس از یادگیری مهمترین مفاهیم هر خانواده از روشها، یک یا چند الگوریتم آنها را از ابتدا در نوتبوکهای jupyter پیادهسازی میکنیم.
تراز کردن ماژول ها:
- تجدید کننده: فرآیند تصمیم گیری مارکوف (MDP).
- Refresher: Q-Learning.
- Refresher: معرفی مختصر شبکه های عصبی.
- Refresher: Deep Q-Learning.
- Refresher: روش های گرادیان خط مشی
یادگیری تقویتی پیشرفته:
- PyTorch Lightning.
- تنظیم فراپارامتر با Optuna.
- یادگیری عمیق Q برای فضاهای کنش مستمر (عملکرد مزیت عادی - NAF).
- گرادیان خط مشی قطعی عمیق (DDPG).
- DDPG تاخیری دوقلو (TD3).
- بازیگر ملایم منتقد (SAC).
- بازپخش تجربه Hindsight (HER).
دوره های عملی و جامع هوش مصنوعی
نمایش نظرات