لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش درک الگوریتم های یادگیری تقویتی
Understanding Algorithms for Reinforcement Learning
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
یادگیری تقویتی نوعی یادگیری ماشینی است که به تصمیم گیرندگان اجازه می دهد در یک محیط ناشناخته عمل کنند. در دنیای ماشینهای خودران و رباتهای کاوشگر، RL یک رشته تحصیلی مهم برای هر دانشجوی یادگیری ماشینی است. الگوریتمهای یادگیری ماشین سنتی برای پیشبینی و طبقهبندی استفاده میشوند. یادگیری تقویتی در مورد آموزش عوامل برای تصمیم گیری برای به حداکثر رساندن پاداش های تجمعی است. در این دوره آموزشی، درک الگوریتمها برای یادگیری تقویتی، اصول اولیه الگوریتمهای یادگیری تقویتی، طبقهبندی RL و تکنیکهای خاص جستجوی سیاست مانند Q-Learning و SARSA را خواهید آموخت. ابتدا، هدف یادگیری تقویتی را کشف خواهید کرد. برای یافتن یک خط مشی بهینه که به نمایندگان اجازه می دهد تا تصمیمات درستی برای به حداکثر رساندن پاداش های بلند مدت بگیرند. شما نحوه مدلسازی محیط را مطالعه خواهید کرد تا الگوریتمهای RL از نظر محاسباتی قابل پردازش باشند. در مرحله بعد، برنامه نویسی پویا را بررسی خواهید کرد، تکنیک مهمی که برای کش کردن نتایج میانی استفاده می شود که محاسبه مسائل پیچیده را ساده می کند. شما تکنیکهای جستجوی خطمشی مانند یادگیری تفاوت زمانی (Q-Learning) و SARSA را درک کرده و پیادهسازی خواهید کرد که به همگرایی به یک خطمشی بهینه برای الگوریتم RL شما کمک میکند. در نهایت، شما پلتفرمهای یادگیری تقویتی را خواهید ساخت که امکان مطالعه، نمونهسازی و توسعه خطمشیها را فراهم میکند و همچنین با تکنیکهای Q-learning و SARSA در OpenAI Gym کار میکند. در پایان این دوره، شما باید درک کاملی از تکنیک های یادگیری تقویتی، یادگیری Q و SARSA داشته باشید و بتوانید الگوریتم های پایه RL را پیاده سازی کنید.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
درک مسئله یادگیری تقویتی
Understanding the Reinforcement Learning Problem
بررسی نسخه
Version Check
نمای کلی ماژول
Module Overview
پیش نیازها و بررسی اجمالی دوره
Prerequisites and Course Overview
تکنیک های یادگیری ماشینی تحت نظارت و بدون نظارت
Supervised and Unsupervised Machine Learning Techniques
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات