آموزش شروع به کار با Gymnasium - آخرین آپدیت

دانلود Getting Started with Gymnasium

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: یادگیری تقویت شده بدون ابزارهای مناسب و درک دقیق از نحوه تعامل عامل‌ها با محیط، می‌تواند چالش‌برانگیز باشد. در این دوره آموزشی با عنوان «شروع به کار با Gymnasium»، شما خواهید آموخت که چگونه از Gymnasium برای طراحی و اجرای محیط‌های شبیه‌سازی، آموزش عامل‌های یادگیری تقویت شده و به‌کارگیری استراتژی‌های تصمیم‌گیری در مسائل کاربردی استفاده کنید. در ابتدا، نحوه ایجاد و پیکربندی محیط‌های Gymnasium را بررسی کرده و نقش عامل‌ها و محیط‌ها و نحوه ارتباط آن‌ها از طریق اکشن‌ها، مشاهدات و پاداش‌ها را درک خواهید کرد. سپس، با استفاده از روش‌های گرادینت سیاست (Policy Gradient) و روش‌های مبتنی بر مقدار (Value-based)، از جمله شبکه Q عمیق (DQN) برای حل محیط CartPole، عامل‌ها را ساخته و آموزش خواهید داد و یاد می‌گیرید که چگونه عملکرد آن‌ها را با استفاده از ابزارها و Wrapperهای Gymnasium ارزیابی و بصری‌سازی کنید. در نهایت، یاد می‌گیرید که چگونه رویکرد Multi-armed Bandit را در یک سناریوی تست A/B واقعی با استفاده از نمونه‌برداری تامپسون (Thompson Sampling) پیاده‌سازی کنید و از تکنیک‌های دیباگینگ، لاگ‌گیری و مانیتورینگ برای اطمینان از رفتار پایدار و قابل اعتماد عامل‌ها استفاده نمایید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم برای استفاده مطمئن از Gymnasium جهت توسعه، تست و بهینه‌سازی عامل‌های یادگیری تقویت شده برای طیف گسترده‌ای از کاربردها را کسب خواهید کرد.

سرفصل ها و درس ها

ایجاد و درک محیط‌های شبیه‌سازی در Gymnasium Creating and Understanding Simulation Environments in Gymnasium

  • نقش‌های عامل و محیط Roles of the Agent and the Environment

  • ایجاد، کاوش و تعامل با محیط Gymnasium Creating, Exploring, and Interacting with a Gymnasium Environment

ساخت و آموزش عامل‌های یادگیری تقویت شده Building and Training Reinforcement Learning Agents

  • پیاده‌سازی یک عامل ساده گرادینت سیاست Implementing a Simple Policy Gradient Agent

  • درک مقادیر Q Understanding Q-Values

  • نمایش یادگیری Q جدولی در Taxi V3 Demonstrating Tabular Q-Learning in Taxi-V3

  • استفاده از شبکه‌های Q عمیق برای حل CartPole Using Deep Q-Networks to Solve CartPole

به‌کارگیری Multi-armed Bandits، محیط‌های سفارشی و بهترین تجربیات Applying Multi-armed Bandits, Custom Environments, and Best Practices

  • درک و پیاده‌سازی نمونه‌برداری تامپسون برای Multi-armed Bandits در یک محیط سفارشی Understanding and Implementing Thompson Sampling for Multi-armed Bandits in a Custom Environment

  • دیباگینگ، مانیتورینگ و تضمین نتایج قابل اعتماد Debugging, Monitoring, and Ensuring Reliable Results

نمایش نظرات

آموزش شروع به کار با Gymnasium
جزییات دوره
42m
8
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Nicolae Caprarescu Nicolae Caprarescu

نیکولای که اکنون یک مشاور مستقل است ، کار خود را از سال 2013 به عنوان مهندس نرم افزار آغاز کرد. طی سالهای گذشته ، نیکولای روی سیستم هایی از موتورهای تجاری جاوا با فرکانس بالا گرفته تا برنامه های مختلف برای شرکت های نوپا کار می کرد. نقش های فنی نیکولای همیشه کاملاً پشته بوده است ، که بیشتر اوقات بر روی انتهای جاوا و جلویی های تحت وب متمرکز بوده است: Java، Spring، JDBC، SQL، Maven، Gradle، TeamCity، Jenkins، TDD، JUnit، تست اتوماتیک ، جاوا اسکریپت ، سلنیوم و RESTful. علایق فنی نیکولای شامل یادگیری ماشین ، معماری نرم افزار و یافتن تعادل مناسب بین استفاده از زبان های تایپ شده ثابت در برابر زبان های تایپ شده پویا است. نیکولای همچنین از استقبال تیمها با پذیرفتن ارزشهای Agile و القا آنها به هر تیمی که بتواند ، لذت می برد. نیکولای دارای مدرک لیسانس درجه یک در رشته علوم کامپیوتر از دانشگاه منچستر است ، و در آنجا اشتیاق خود را برای تدریس هنگام راهنمایی سایر دانشجویان کشف کرد. نیکولای همچنین از مسافرت و اتومبیلرانی لذت می برد.