دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش بنیادهای یادگیری تقویت

Reinforcement Learning Foundations

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: نوآوری در امور مالی ، بهداشت ، رباتیک و سایر بخشهای دیگر با یادگیری تقویت (RL) ، که شامل آموزش ماشین آلات برای یادگیری از محیط آنها است ، امکان پذیر شده است. بسیاری از شرکت های برتر فناوری در این زمینه سرمایه گذاری زیادی می کنند. در این دوره ، مدرس Khaulat Abdulhakeem به شما کمک می کند تا اصول این مهارت نسبتاً جدید ، اما ارزشمند را یاد بگیرید. اصطلاحات کلیدی مورد استفاده در RL ، چگونگی نقش RL در پیشرفت AI و انواع مشکلاتی که می توانید برای حل آنها از RL استفاده کنید را بشناسید. خالات به شما نشان می دهد چگونه مشکلات یادگیری تقویت کننده را تعریف و نشان دهید. او همچنین به الگوریتم های RL ، از جمله روش های مونت کارلو و تفاوت زمانی می پردازد. به علاوه ، او RL عمیق و چندعاملی و همچنین نحوه یادگیری معکوس و اینکه چگونه می تواند با تقلید به عوامل کمک کند را کشف می کند.

سرفصل ها و درس ها

مقدمه Introduction

به طور خلاصه یادگیری تقویت Reinforcement learning in a nutshell

1. شروع با یادگیری تقویت 1. Getting Started with Reinforcement Learning

اصطلاحات در یادگیری تقویت Terms in reinforcement learning
یک مشکل اساسی RL A basic RL problem
روند تصمیم گیری مارکوف Markov decision process
یک راه حل اساسی RL A basic RL solution

2. الگوریتم های یادگیری تقویت 2. Reinforcement Learning Algorithms

روش مونت کارلو Monte Carlo method
روش های اختلاف زمانی Temporal difference methods
سایر الگوریتم های RL Other RL algorithms

3. روش مونت کارلو 3. Monte Carlo Method

تنظیمات The setting
اکتشاف و بهره برداری Exploration and exploitation
پیش بینی مونت کارلو Monte Carlo prediction
اولین بازدید و هر بازدید پیش بینی MC First visit and every visit MC prediction
کنترل مونت کارلو Monte Carlo control
تغییرات اضافی Additional modifications

4. روش های تفاوت زمانی 4. Temporal Difference Methods

تنظیمات The setting
سارسا SARSA
SARSAMAX (یادگیری Q) SARSAMAX (Q-learning)
SARSA مورد انتظار Expected SARSA

5. فرم های اصلاح شده اصلاح شده 5. Modified Forms of Reinforcement

یادگیری تقویت عمیق Deep reinforcement learning
یادگیری تقویت چند عاملی Multi-agent reinforcement learning
یادگیری تقویت معکوس Inverse reinforcement learning

نتیجه Conclusion

سفر یادگیری تقویت کننده شما Your reinforcement learning journey

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

جزییات دوره

زمان دوره: 45m 31s

تعداد ویدیو ها: 22

شرکت: Linkedin (لینکدین)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 58

امتیاز مرجع: - از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Khaulat Abdulhakeem

لینک کوتاه این دوره

https://donyad.com/d/75f0

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Khaulat Abdulhakeem

بنیانگذار DiverseK

Khaulat Abdulhakeem به دانشجویان و فارغ التحصیلان اخیر کمک می کند تا در حرفه فناوری رویایی خود حرکت کنند.

Khaulat بنیانگذار DiverseK.com است، پلتفرمی که منابع مفید توسعه شغلی فناوری، مشاوره شغلی، و مصاحبه با کارشناسان صنعت فناوری را ارائه می دهد. . او سابقه ای در تحقیقات هوش مصنوعی دارد و در مورد بینایی ماشین، یادگیری تقویتی، و روباتیک تحقیق کرده است.

در DiverseK.com می توانید در مورد اینکه چگونه DiverseK می تواند به شما کمک کند حرفه فنی خود را شروع کرده و به پیش ببرید، بیشتر بیاموزید."

Python پایتون Big Data IT داده های بزرگ

بانکهای اطلاعاتی

اطلاعات بزرگ

توسعه

آموزش بنیادهای یادگیری تقویت

Reinforcement Learning Foundations

مقدمه Introduction

به طور خلاصه یادگیری تقویت Reinforcement learning in a nutshell

1. شروع با یادگیری تقویت 1. Getting Started with Reinforcement Learning

اصطلاحات در یادگیری تقویت Terms in reinforcement learning

یک مشکل اساسی RL A basic RL problem

روند تصمیم گیری مارکوف Markov decision process

یک راه حل اساسی RL A basic RL solution

2. الگوریتم های یادگیری تقویت 2. Reinforcement Learning Algorithms

روش مونت کارلو Monte Carlo method

روش های اختلاف زمانی Temporal difference methods

سایر الگوریتم های RL Other RL algorithms

3. روش مونت کارلو 3. Monte Carlo Method

تنظیمات The setting

اکتشاف و بهره برداری Exploration and exploitation

پیش بینی مونت کارلو Monte Carlo prediction

اولین بازدید و هر بازدید پیش بینی MC First visit and every visit MC prediction

کنترل مونت کارلو Monte Carlo control

تغییرات اضافی Additional modifications

4. روش های تفاوت زمانی 4. Temporal Difference Methods

تنظیمات The setting

سارسا SARSA

SARSAMAX (یادگیری Q) SARSAMAX (Q-learning)

SARSA مورد انتظار Expected SARSA

5. فرم های اصلاح شده اصلاح شده 5. Modified Forms of Reinforcement

یادگیری تقویت عمیق Deep reinforcement learning

یادگیری تقویت چند عاملی Multi-agent reinforcement learning

یادگیری تقویت معکوس Inverse reinforcement learning