دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش مقدماتی یادگیری تقویت‌شده (Reinforcement Learning) - آخرین آپدیت

دانلود Introduction to Reinforcement Learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: یادگیری تقویت‌شده یکی از حوزه‌های قدرتمند یادگیری ماشین است که در آن عامل‌ها از طریق تعامل و کاوش در محیط خود، یاد می‌گیرند. در این دوره آموزشی «مقدمه‌ای بر یادگیری تقویت‌شده»، شما با مفاهیم پایه و عناصر کلیدی این حوزه آشنا خواهید شد. در ابتدا، نحوه مدل‌سازی مسائل یادگیری با استفاده از فرآیندهای تصمیم‌گیری مارکوف (MDP) را بررسی می‌کنیم. سپس، الگوریتم‌های بنیادینی مانند برنامه‌نویسی پویا (Dynamic Programming) و روش‌های مونت‌کارلو را خواهید آموخت که به عامل اجازه می‌دهند از طریق تجربه یاد بگیرند. در نهایت، با روش‌های کاربردی‌تر و پیشرفته‌تری مانند یادگیری تفاضل زمانی (Temporal Difference)، Q-learning و یادگیری تقویت‌شده عمیق آشنا می‌شوید. پس از پایان این دوره، شما مهارت‌ها و دانش لازم برای پیاده‌سازی یادگیری تقویت‌شده و به‌کارگیری آن در طیف گسترده‌ای از مسائل یادگیری ماشین را به‌دست خواهید آورد.

سرفصل ها و درس ها

مقدمه‌ای بر یادگیری تقویت‌شده Introduction to Reinforcement Learning

آشنایی با یادگیری تقویت‌شده Introduction to Reinforcement Learning
یادگیری تقویت‌شده به عنوان یک شاخه از یادگیری ماشین Reinforcement Learning as a Machine Learning Discipline
عناصر یادگیری تقویت‌شده Elements of Reinforcement Learning
تاریخچه مختصر A Brief History
باندیت‌های چند بازویی (Multi-armed Bandits) Multi-armed Bandits
استراتژی‌های اکتشاف، بهره‌برداری و اپسیلون-greedy Exploration, Exploitation, and Epsilon-greedy Strategies
فرآیندهای تصمیم‌گیری مارکوف (MDPs) Markov Decision Processes (MDPs)
احتمالات انتقال Transition Probabilities
مثال‌هایی از MDPها Examples of MDPs
بازده تخفیف‌خورده (Discounted Return) Discounted Return
سیاست (Policy) Policy

مبانی الگوریتم یادگیری تقویت‌شده Basics of the Reinforcement Learning Algorithm

برنامه‌نویسی پویا Dynamic Programming
مثال کاربردی: شکلات‌ها Example Problem: Candy Bars
بهبود تکرار شونده Iterative Improvement
دموی محیط Gridworld Demo: Gridworld
نقاط قوت و ضعف برنامه‌نویسی پویا Strengths and Weaknesses of Dynamic Programming
روش‌های مونت‌کارلو Monte Carlo Methods
دموی مونت‌کارلو در Gridworld Demo: Monte Carlo Gridworld
کاربردهای واقعی روش‌های مونت‌کارلو Real-world Applications of Monte Carlo Methods
تفاوت On-policy و Off-policy On-policy vs. Off-policy
یادگیری تفاضل زمانی (TD Learning) Temporal Difference (TD) Learning
الگوریتم TD(0) TD(0)
الگوریتم‌های TD TD Algorithms
ملاحظات کاربردی Practical Considerations

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش مقدماتی یادگیری تقویت‌شده (Reinforcement Learning)

جزییات دوره

زمان دوره: 1h 26m

تعداد ویدیو ها: 24

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 5

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Reindert-Jan Ekker

لینک کوتاه این دوره

https://donyad.com/d/30ffbe

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Reindert-Jan Ekker

پس از سالها کار در زمینه تولید نرم افزار ، Reindert-Jan Ekker در سال 2010 به تدریس برنامه نویسان روی آورد و هرگز به گذشته نگاه نکرد. او نویسنده دوره های Pluralsight است و کلاسهایی را درباره پایتون ، علوم داده ، devops (و سایر موارد) تدریس می کند. حتی اگر او بعضی از مشاغل توسعه را در اینجا و آنجا تحت فشار قرار دهد ، تدریس علاقه واقعی او است و او مشتاقانه منتظر است که این اشتیاق را با شما به اشتراک بگذارد.

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش مقدماتی یادگیری تقویت‌شده (Reinforcement Learning) - آخرین آپدیت

دانلود Introduction to Reinforcement Learning

مقدمه‌ای بر یادگیری تقویت‌شده Introduction to Reinforcement Learning

آشنایی با یادگیری تقویت‌شده Introduction to Reinforcement Learning

یادگیری تقویت‌شده به عنوان یک شاخه از یادگیری ماشین Reinforcement Learning as a Machine Learning Discipline

عناصر یادگیری تقویت‌شده Elements of Reinforcement Learning

تاریخچه مختصر A Brief History

باندیت‌های چند بازویی (Multi-armed Bandits) Multi-armed Bandits

استراتژی‌های اکتشاف، بهره‌برداری و اپسیلون-greedy Exploration, Exploitation, and Epsilon-greedy Strategies

فرآیندهای تصمیم‌گیری مارکوف (MDPs) Markov Decision Processes (MDPs)

احتمالات انتقال Transition Probabilities

مثال‌هایی از MDPها Examples of MDPs

بازده تخفیف‌خورده (Discounted Return) Discounted Return

سیاست (Policy) Policy

مبانی الگوریتم یادگیری تقویت‌شده Basics of the Reinforcement Learning Algorithm

برنامه‌نویسی پویا Dynamic Programming

مثال کاربردی: شکلات‌ها Example Problem: Candy Bars

بهبود تکرار شونده Iterative Improvement

دموی محیط Gridworld Demo: Gridworld

نقاط قوت و ضعف برنامه‌نویسی پویا Strengths and Weaknesses of Dynamic Programming

روش‌های مونت‌کارلو Monte Carlo Methods

دموی مونت‌کارلو در Gridworld Demo: Monte Carlo Gridworld

کاربردهای واقعی روش‌های مونت‌کارلو Real-world Applications of Monte Carlo Methods

تفاوت On-policy و Off-policy On-policy vs. Off-policy

یادگیری تفاضل زمانی (TD Learning) Temporal Difference (TD) Learning

الگوریتم TD(0) TD(0)

الگوریتم‌های TD TD Algorithms

ملاحظات کاربردی Practical Considerations