لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش یادگیری تقویتی مدرن: یادگیری عمیق Q در PyTorch
Modern Reinforcement Learning: Deep Q Learning in PyTorch
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
نحوه تبدیل مقالات تحقیقاتی Deep Reinforcement Learning به عواملی که بازیهای کلاسیک Atari را شکست میدهند نحوه خواندن و پیادهسازی مقالات یادگیری تقویتی عمیق نحوه کدنویسی عوامل یادگیری Deep Q نحوه کدنویسی Double Deep Q عوامل یادگیری نحوه کدنویسی Dueling Deep Q و Dueling Double Deep Q آموزش عوامل آموزش نحوه نوشتن نرم افزار یادگیری تقویتی عمیق ماژولار و توسعه پذیر نحوه خودکارسازی تنظیم هایپرپارامتر با آرگومان های خط فرمان
در این دوره آموزشی کامل تقویت عمیق، شما یک چارچوب قابل تکرار برای خواندن و اجرای مقالات تحقیقاتی یادگیری تقویتی عمیق را خواهید آموخت. مقاله های اصلی را خواهید خواند که الگوریتم های یادگیری Deep Q ، یادگیری Double Deep Q و Dueling Deep Q را معرفی کرده اند. سپس یاد خواهید گرفت که چگونه این کدها را در کد پایتونیک و مختصر PyTorch پیاده سازی کنید، که می تواند برای شامل هر الگوریتم یادگیری عمیق Q در آینده گسترش یابد. این الگوریتمها برای حل انواع محیطها از کتابخانه Atari ورزشگاه Open AI از جمله Pong، Breakout و Bankheist استفاده خواهند شد.
شما کلید کارکردن این الگوریتمهای Deep Q Learning را یاد خواهید گرفت، یعنی چگونه میتوانید کتابخانه Atari Open AI Gym را برای مطابقت با مشخصات مقالات اصلی Deep Q Learning تغییر دهید. شما یاد خواهید گرفت که چگونه:
اقدامات را برای کاهش سربار محاسباتی تکرار کنید
تصاویر صفحه نمایش Atari را برای افزایش کارایی تغییر مقیاس دهید
قابها را روی هم قرار دهید تا به عامل Deep Q حس حرکت بدهید
عملکرد Deep Q agent را با بدون عملیات تصادفی ارزیابی کنید تا با مدل بیش از آموزش مقابله کنید
جوایز کلیپ برای فعال کردن عامل یادگیری Deep Q برای تعمیم بازیهای Atari با مقیاسهای امتیازی مختلف
اگر تجربه قبلی در زمینه تقویت یا یادگیری تقویتی عمیق ندارید، مشکلی نیست. در این دوره یک دوره کامل و مختصر در مورد مبانی یادگیری تقویتی گنجانده شده است. دوره مقدماتی یادگیری تقویتی در زمینه حل محیط دریاچه یخ زده از Open AI Gym تدریس می شود.
ما پوشش خواهیم داد:
فرایندهای تصمیم مارکوف
یادگیری تفاوت زمانی
الگوریتم اصلی یادگیری Q
نحوه حل معادله بلمن
توابع ارزش و توابع ارزش عمل
آموزش تقویتی مبتنی بر مدل رایگان در مقابل مدل
راهحلهایی برای معضل کاوش- بهرهبرداری، از جمله مقادیر اولیه خوشبینانه و انتخاب اقدام حریصانه اپسیلون
همچنین یک دوره آموزشی کوچک در یادگیری عمیق با استفاده از چارچوب PyTorch گنجانده شده است. این برای دانشآموزانی است که با مفاهیم اساسی یادگیری عمیق آشنا هستند، اما با جزئیات آشنا نیستند، یا کسانی که با یادگیری عمیق در چارچوب دیگری، مانند Tensorflow یا Keras راحت هستند. با نحوه کدنویسی یک شبکه عصبی عمیق در Pytorch و همچنین نحوه عملکرد شبکه های عصبی کانولوشن آشنا خواهید شد. این در اجرای یک عامل یادگیری ساده Deep Q برای حل مشکل Cartpole از ورزشگاه Open AI استفاده خواهد شد.
سرفصل ها و درس ها
معرفی
Introduction
آنچه در این دوره خواهید آموخت
What You Will Learn In This Course
پس زمینه، نرم افزار و سخت افزار مورد نیاز
Required Background, software, and hardware
چگونه در این دوره موفق شویم
How to Succeed in this Course
مبانی یادگیری تقویتی
Fundamentals of Reinforcement Learning
عوامل، محیط ها و اقدامات
Agents, Environments, and Actions
نمایش نظرات