آموزش بنیادهای یادگیری تقویت

Reinforcement Learning Foundations

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: نوآوری در امور مالی ، بهداشت ، رباتیک و سایر بخشهای دیگر با یادگیری تقویت (RL) ، که شامل آموزش ماشین آلات برای یادگیری از محیط آنها است ، امکان پذیر شده است. بسیاری از شرکت های برتر فناوری در این زمینه سرمایه گذاری زیادی می کنند. در این دوره ، مدرس Khaulat Abdulhakeem به شما کمک می کند تا اصول این مهارت نسبتاً جدید ، اما ارزشمند را یاد بگیرید. اصطلاحات کلیدی مورد استفاده در RL ، چگونگی نقش RL در پیشرفت AI و انواع مشکلاتی که می توانید برای حل آنها از RL استفاده کنید را بشناسید. خالات به شما نشان می دهد چگونه مشکلات یادگیری تقویت کننده را تعریف و نشان دهید. او همچنین به الگوریتم های RL ، از جمله روش های مونت کارلو و تفاوت زمانی می پردازد. به علاوه ، او RL عمیق و چندعاملی و همچنین نحوه یادگیری معکوس و اینکه چگونه می تواند با تقلید به عوامل کمک کند را کشف می کند.

سرفصل ها و درس ها

مقدمه Introduction

  • به طور خلاصه یادگیری تقویت Reinforcement learning in a nutshell

1. شروع با یادگیری تقویت 1. Getting Started with Reinforcement Learning

  • اصطلاحات در یادگیری تقویت Terms in reinforcement learning

  • یک مشکل اساسی RL A basic RL problem

  • روند تصمیم گیری مارکوف Markov decision process

  • یک راه حل اساسی RL A basic RL solution

2. الگوریتم های یادگیری تقویت 2. Reinforcement Learning Algorithms

  • روش مونت کارلو Monte Carlo method

  • روش های اختلاف زمانی Temporal difference methods

  • سایر الگوریتم های RL Other RL algorithms

3. روش مونت کارلو 3. Monte Carlo Method

  • تنظیمات The setting

  • اکتشاف و بهره برداری Exploration and exploitation

  • پیش بینی مونت کارلو Monte Carlo prediction

  • اولین بازدید و هر بازدید پیش بینی MC First visit and every visit MC prediction

  • کنترل مونت کارلو Monte Carlo control

  • تغییرات اضافی Additional modifications

4. روش های تفاوت زمانی 4. Temporal Difference Methods

  • تنظیمات The setting

  • سارسا SARSA

  • SARSAMAX (یادگیری Q) SARSAMAX (Q-learning)

  • SARSA مورد انتظار Expected SARSA

5. فرم های اصلاح شده اصلاح شده 5. Modified Forms of Reinforcement

  • یادگیری تقویت عمیق Deep reinforcement learning

  • یادگیری تقویت چند عاملی Multi-agent reinforcement learning

  • یادگیری تقویت معکوس Inverse reinforcement learning

نتیجه Conclusion

  • سفر یادگیری تقویت کننده شما Your reinforcement learning journey

نمایش نظرات

نظری ارسال نشده است.

آموزش بنیادهای یادگیری تقویت
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
45m 31s
22
Linkedin (لینکدین) lynda-small
03 بهمن 1399 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
58
- از 5
ندارد
دارد
دارد

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Khaulat Abdulhakeem Khaulat Abdulhakeem

بنیانگذار DiverseK

Khaulat Abdulhakeem به دانشجویان و فارغ التحصیلان اخیر کمک می کند تا در حرفه فناوری رویایی خود حرکت کنند.

Khaulat بنیانگذار DiverseK.com است، پلتفرمی که منابع مفید توسعه شغلی فناوری، مشاوره شغلی، و مصاحبه با کارشناسان صنعت فناوری را ارائه می دهد. . او سابقه ای در تحقیقات هوش مصنوعی دارد و در مورد بینایی ماشین، یادگیری تقویتی، و روباتیک تحقیق کرده است.

در DiverseK.com می توانید در مورد اینکه چگونه DiverseK می تواند به شما کمک کند حرفه فنی خود را شروع کرده و به پیش ببرید، بیشتر بیاموزید."

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.