آموزش بنیادهای یادگیری تقویت

Reinforcement Learning Foundations

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: نوآوری در امور مالی ، بهداشت ، رباتیک و سایر بخشهای دیگر با یادگیری تقویت (RL) ، که شامل آموزش ماشین آلات برای یادگیری از محیط آنها است ، امکان پذیر شده است. بسیاری از شرکت های برتر فناوری در این زمینه سرمایه گذاری زیادی می کنند. در این دوره ، مدرس Khaulat Abdulhakeem به شما کمک می کند تا اصول این مهارت نسبتاً جدید ، اما ارزشمند را یاد بگیرید. اصطلاحات کلیدی مورد استفاده در RL ، چگونگی نقش RL در پیشرفت AI و انواع مشکلاتی که می توانید برای حل آنها از RL استفاده کنید را بشناسید. خالات به شما نشان می دهد چگونه مشکلات یادگیری تقویت کننده را تعریف و نشان دهید. او همچنین به الگوریتم های RL ، از جمله روش های مونت کارلو و تفاوت زمانی می پردازد. به علاوه ، او RL عمیق و چندعاملی و همچنین نحوه یادگیری معکوس و اینکه چگونه می تواند با تقلید به عوامل کمک کند را کشف می کند.

سرفصل ها و درس ها

مقدمه Introduction

  • به طور خلاصه یادگیری تقویت Reinforcement learning in a nutshell

1. شروع با یادگیری تقویت 1. Getting Started with Reinforcement Learning

  • اصطلاحات در یادگیری تقویت Terms in reinforcement learning

  • یک مشکل اساسی RL A basic RL problem

  • روند تصمیم گیری مارکوف Markov decision process

  • یک راه حل اساسی RL A basic RL solution

2. الگوریتم های یادگیری تقویت 2. Reinforcement Learning Algorithms

  • روش مونت کارلو Monte Carlo method

  • روش های اختلاف زمانی Temporal difference methods

  • سایر الگوریتم های RL Other RL algorithms

3. روش مونت کارلو 3. Monte Carlo Method

  • تنظیمات The setting

  • اکتشاف و بهره برداری Exploration and exploitation

  • پیش بینی مونت کارلو Monte Carlo prediction

  • اولین بازدید و هر بازدید پیش بینی MC First visit and every visit MC prediction

  • کنترل مونت کارلو Monte Carlo control

  • تغییرات اضافی Additional modifications

4. روش های تفاوت زمانی 4. Temporal Difference Methods

  • تنظیمات The setting

  • سارسا SARSA

  • SARSAMAX (یادگیری Q) SARSAMAX (Q-learning)

  • SARSA مورد انتظار Expected SARSA

5. فرم های اصلاح شده اصلاح شده 5. Modified Forms of Reinforcement

  • یادگیری تقویت عمیق Deep reinforcement learning

  • یادگیری تقویت چند عاملی Multi-agent reinforcement learning

  • یادگیری تقویت معکوس Inverse reinforcement learning

نتیجه Conclusion

  • سفر یادگیری تقویت کننده شما Your reinforcement learning journey

نمایش نظرات

آموزش بنیادهای یادگیری تقویت
جزییات دوره
45m 31s
22
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
58
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Khaulat Abdulhakeem Khaulat Abdulhakeem

بنیانگذار DiverseK

Khaulat Abdulhakeem به دانشجویان و فارغ التحصیلان اخیر کمک می کند تا در حرفه فناوری رویایی خود حرکت کنند.

Khaulat بنیانگذار DiverseK.com است، پلتفرمی که منابع مفید توسعه شغلی فناوری، مشاوره شغلی، و مصاحبه با کارشناسان صنعت فناوری را ارائه می دهد. . او سابقه ای در تحقیقات هوش مصنوعی دارد و در مورد بینایی ماشین، یادگیری تقویتی، و روباتیک تحقیق کرده است.

در DiverseK.com می توانید در مورد اینکه چگونه DiverseK می تواند به شما کمک کند حرفه فنی خود را شروع کرده و به پیش ببرید، بیشتر بیاموزید."