آموزش مقدماتی یادگیری تقویت‌شده (Reinforcement Learning) - آخرین آپدیت

دانلود Introduction to Reinforcement Learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: یادگیری تقویت‌شده یکی از حوزه‌های قدرتمند یادگیری ماشین است که در آن عامل‌ها از طریق تعامل و کاوش در محیط خود، یاد می‌گیرند. در این دوره آموزشی «مقدمه‌ای بر یادگیری تقویت‌شده»، شما با مفاهیم پایه و عناصر کلیدی این حوزه آشنا خواهید شد. در ابتدا، نحوه مدل‌سازی مسائل یادگیری با استفاده از فرآیندهای تصمیم‌گیری مارکوف (MDP) را بررسی می‌کنیم. سپس، الگوریتم‌های بنیادینی مانند برنامه‌نویسی پویا (Dynamic Programming) و روش‌های مونت‌کارلو را خواهید آموخت که به عامل اجازه می‌دهند از طریق تجربه یاد بگیرند. در نهایت، با روش‌های کاربردی‌تر و پیشرفته‌تری مانند یادگیری تفاضل زمانی (Temporal Difference)، Q-learning و یادگیری تقویت‌شده عمیق آشنا می‌شوید. پس از پایان این دوره، شما مهارت‌ها و دانش لازم برای پیاده‌سازی یادگیری تقویت‌شده و به‌کارگیری آن در طیف گسترده‌ای از مسائل یادگیری ماشین را به‌دست خواهید آورد.

سرفصل ها و درس ها

مقدمه‌ای بر یادگیری تقویت‌شده Introduction to Reinforcement Learning

  • آشنایی با یادگیری تقویت‌شده Introduction to Reinforcement Learning

  • یادگیری تقویت‌شده به عنوان یک شاخه از یادگیری ماشین Reinforcement Learning as a Machine Learning Discipline

  • عناصر یادگیری تقویت‌شده Elements of Reinforcement Learning

  • تاریخچه مختصر A Brief History

  • باندیت‌های چند بازویی (Multi-armed Bandits) Multi-armed Bandits

  • استراتژی‌های اکتشاف، بهره‌برداری و اپسیلون-greedy Exploration, Exploitation, and Epsilon-greedy Strategies

  • فرآیندهای تصمیم‌گیری مارکوف (MDPs) Markov Decision Processes (MDPs)

  • احتمالات انتقال Transition Probabilities

  • مثال‌هایی از MDPها Examples of MDPs

  • بازده تخفیف‌خورده (Discounted Return) Discounted Return

  • سیاست (Policy) Policy

مبانی الگوریتم یادگیری تقویت‌شده Basics of the Reinforcement Learning Algorithm

  • برنامه‌نویسی پویا Dynamic Programming

  • مثال کاربردی: شکلات‌ها Example Problem: Candy Bars

  • بهبود تکرار شونده Iterative Improvement

  • دموی محیط Gridworld Demo: Gridworld

  • نقاط قوت و ضعف برنامه‌نویسی پویا Strengths and Weaknesses of Dynamic Programming

  • روش‌های مونت‌کارلو Monte Carlo Methods

  • دموی مونت‌کارلو در Gridworld Demo: Monte Carlo Gridworld

  • کاربردهای واقعی روش‌های مونت‌کارلو Real-world Applications of Monte Carlo Methods

  • تفاوت On-policy و Off-policy On-policy vs. Off-policy

  • یادگیری تفاضل زمانی (TD Learning) Temporal Difference (TD) Learning

  • الگوریتم TD(0) TD(0)

  • الگوریتم‌های TD TD Algorithms

  • ملاحظات کاربردی Practical Considerations

نمایش نظرات

آموزش مقدماتی یادگیری تقویت‌شده (Reinforcement Learning)
جزییات دوره
1h 26m
24
(آخرین آپدیت)
5
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Reindert-Jan Ekker Reindert-Jan Ekker

پس از سالها کار در زمینه تولید نرم افزار ، Reindert-Jan Ekker در سال 2010 به تدریس برنامه نویسان روی آورد و هرگز به گذشته نگاه نکرد. او نویسنده دوره های Pluralsight است و کلاسهایی را درباره پایتون ، علوم داده ، devops (و سایر موارد) تدریس می کند. حتی اگر او بعضی از مشاغل توسعه را در اینجا و آنجا تحت فشار قرار دهد ، تدریس علاقه واقعی او است و او مشتاقانه منتظر است که این اشتیاق را با شما به اشتراک بگذارد.