دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش شروع به کار با Gymnasium - آخرین آپدیت

دانلود Getting Started with Gymnasium

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: یادگیری تقویت شده بدون ابزارهای مناسب و درک دقیق از نحوه تعامل عامل‌ها با محیط، می‌تواند چالش‌برانگیز باشد. در این دوره آموزشی با عنوان «شروع به کار با Gymnasium»، شما خواهید آموخت که چگونه از Gymnasium برای طراحی و اجرای محیط‌های شبیه‌سازی، آموزش عامل‌های یادگیری تقویت شده و به‌کارگیری استراتژی‌های تصمیم‌گیری در مسائل کاربردی استفاده کنید. در ابتدا، نحوه ایجاد و پیکربندی محیط‌های Gymnasium را بررسی کرده و نقش عامل‌ها و محیط‌ها و نحوه ارتباط آن‌ها از طریق اکشن‌ها، مشاهدات و پاداش‌ها را درک خواهید کرد. سپس، با استفاده از روش‌های گرادینت سیاست (Policy Gradient) و روش‌های مبتنی بر مقدار (Value-based)، از جمله شبکه Q عمیق (DQN) برای حل محیط CartPole، عامل‌ها را ساخته و آموزش خواهید داد و یاد می‌گیرید که چگونه عملکرد آن‌ها را با استفاده از ابزارها و Wrapperهای Gymnasium ارزیابی و بصری‌سازی کنید. در نهایت، یاد می‌گیرید که چگونه رویکرد Multi-armed Bandit را در یک سناریوی تست A/B واقعی با استفاده از نمونه‌برداری تامپسون (Thompson Sampling) پیاده‌سازی کنید و از تکنیک‌های دیباگینگ، لاگ‌گیری و مانیتورینگ برای اطمینان از رفتار پایدار و قابل اعتماد عامل‌ها استفاده نمایید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم برای استفاده مطمئن از Gymnasium جهت توسعه، تست و بهینه‌سازی عامل‌های یادگیری تقویت شده برای طیف گسترده‌ای از کاربردها را کسب خواهید کرد.

سرفصل ها و درس ها

ایجاد و درک محیط‌های شبیه‌سازی در Gymnasium Creating and Understanding Simulation Environments in Gymnasium

نقش‌های عامل و محیط Roles of the Agent and the Environment
ایجاد، کاوش و تعامل با محیط Gymnasium Creating, Exploring, and Interacting with a Gymnasium Environment

ساخت و آموزش عامل‌های یادگیری تقویت شده Building and Training Reinforcement Learning Agents

پیاده‌سازی یک عامل ساده گرادینت سیاست Implementing a Simple Policy Gradient Agent
درک مقادیر Q Understanding Q-Values
نمایش یادگیری Q جدولی در Taxi V3 Demonstrating Tabular Q-Learning in Taxi-V3
استفاده از شبکه‌های Q عمیق برای حل CartPole Using Deep Q-Networks to Solve CartPole

به‌کارگیری Multi-armed Bandits، محیط‌های سفارشی و بهترین تجربیات Applying Multi-armed Bandits, Custom Environments, and Best Practices

درک و پیاده‌سازی نمونه‌برداری تامپسون برای Multi-armed Bandits در یک محیط سفارشی Understanding and Implementing Thompson Sampling for Multi-armed Bandits in a Custom Environment
دیباگینگ، مانیتورینگ و تضمین نتایج قابل اعتماد Debugging, Monitoring, and Ensuring Reliable Results

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

جزییات دوره

زمان دوره: 42m

تعداد ویدیو ها: 8

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 3

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Nicolae Caprarescu

لینک کوتاه این دوره

https://donyad.com/d/ceb75f

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Nicolae Caprarescu

نیکولای که اکنون یک مشاور مستقل است ، کار خود را از سال 2013 به عنوان مهندس نرم افزار آغاز کرد. طی سالهای گذشته ، نیکولای روی سیستم هایی از موتورهای تجاری جاوا با فرکانس بالا گرفته تا برنامه های مختلف برای شرکت های نوپا کار می کرد. نقش های فنی نیکولای همیشه کاملاً پشته بوده است ، که بیشتر اوقات بر روی انتهای جاوا و جلویی های تحت وب متمرکز بوده است: Java، Spring، JDBC، SQL، Maven، Gradle، TeamCity، Jenkins، TDD، JUnit، تست اتوماتیک ، جاوا اسکریپت ، سلنیوم و RESTful. علایق فنی نیکولای شامل یادگیری ماشین ، معماری نرم افزار و یافتن تعادل مناسب بین استفاده از زبان های تایپ شده ثابت در برابر زبان های تایپ شده پویا است. نیکولای همچنین از استقبال تیمها با پذیرفتن ارزشهای Agile و القا آنها به هر تیمی که بتواند ، لذت می برد. نیکولای دارای مدرک لیسانس درجه یک در رشته علوم کامپیوتر از دانشگاه منچستر است ، و در آنجا اشتیاق خود را برای تدریس هنگام راهنمایی سایر دانشجویان کشف کرد. نیکولای همچنین از مسافرت و اتومبیلرانی لذت می برد.

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش شروع به کار با Gymnasium - آخرین آپدیت

دانلود Getting Started with Gymnasium

ایجاد و درک محیط‌های شبیه‌سازی در Gymnasium Creating and Understanding Simulation Environments in Gymnasium

نقش‌های عامل و محیط Roles of the Agent and the Environment

ایجاد، کاوش و تعامل با محیط Gymnasium Creating, Exploring, and Interacting with a Gymnasium Environment

ساخت و آموزش عامل‌های یادگیری تقویت شده Building and Training Reinforcement Learning Agents

پیاده‌سازی یک عامل ساده گرادینت سیاست Implementing a Simple Policy Gradient Agent

درک مقادیر Q Understanding Q-Values

نمایش یادگیری Q جدولی در Taxi V3 Demonstrating Tabular Q-Learning in Taxi-V3

استفاده از شبکه‌های Q عمیق برای حل CartPole Using Deep Q-Networks to Solve CartPole