آموزش روش‌های مونت کارلو - آخرین آپدیت

دانلود Monte Carlo Methods

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: روش‌های مونت کارلو ممکن است انتزاعی به نظر برسند و متخصصان را در مورد تبدیل بازده‌های اپیزودیک به تخمین‌های ارزشی موثر، پالیسی‌ها و شبکه‌های قابل آموزش دچار تردید کنند. در این دوره آموزشی با عنوان «روش‌های مونت کارلو»، شما یاد می‌گیرید که عامل‌های یادگیری تقویت‌شده مبتنی بر مونت کارلو را به صورت کامل (End-to-End) بسازید و ارزیابی کنید. ابتدا، پیش‌بینی مونت کارلو را با نمونه‌برداری اپیزودیک و تفاوت‌های بین تخمین‌های «اولین بازدید» (First-Visit) و «هر بازدید» (Every-Visit) بررسی خواهید کرد. سپس، کنترل مونت کارلو را با استفاده از پالیسی‌های $ε$-greedy برای استخراج رفتار بهینه از تجربیات شناسایی می‌کنید. در نهایت، نحوه پیاده‌سازی الگوریتم گرادینت پالیسی REINFORCE را در PyTorch می‌آموزید و عملکرد آن را روی محیط CartPole ارزیابی می‌کنید. در پایان این دوره، شما مهارت‌ها و دانش لازم از روش‌های مونت کارلو در یادگیری تقویت‌شده را برای طراحی، پیاده‌سازی و ارزیابی عامل‌های پیش‌بینی، کنترل و گرادینت پالیسی کسب خواهید کرد.

سرفصل ها و درس ها

مقدمه‌ای بر روش‌های مونت کارلو Introduction to Monte Carlo Methods

  • مقدمه Introduction

  • شبیه‌سازی مونت کارلو در بلک‌جک Blackjack Monte Carlo Simulation

کنترل‌های مونت کارلو Monte Carlo Controls

  • آشنایی با کنترل‌ها Introducing Controls

  • کنترل مونت کارلو $ε$-Soft در بلک‌جک ε-Soft Monte Carlo Control on Blackjack

گرادینت‌های پالیسی و REINFORCE Policy Gradients & REINFORCE

  • الگوریتم REINFORCE The REINFORCE Algorithm

  • پیاده‌سازی عملی REINFORCE REINFORCE in Action

نمایش نظرات

آموزش روش‌های مونت کارلو
جزییات دوره
34m
6
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Anthony Alampi Anthony Alampi

من آنتونی آلامپی هستم ، یک طراح و توسعه دهنده تعاملی ساکن آستین ، تگزاس. من یک توسعه دهنده حرفه ای بازی های ویدیویی و صاحب فعلی شرکت طراحی وب با بیش از 15 سال تجربه برنامه نویسی و بیش از 7 سال تجربه طراحی هستم. طراحی کاربر محور علاقه من است و معتقدم وقتی کاربران در اولویت قرار می گیرند ، دوباره برمی گردند! نمونه کارهای شخصی من را می توانید در این آدرس مشاهده کنید: https://www.anthonyalampi.com/درباره شرکت من: مشاوران X Factor یک شرکت طراحی دیجیتال است که در Round Rock ، تگزاس مستقر است. ما در ایجاد وب سایت های تمیز ، کاربر پسند و آرم های چشم نواز ، رسانه های دیجیتال و سایر مواد بازاریابی برای طیف گسترده ای از صنایع تخصص داریم. ما همچنین خدمات اصلی نوشتن محتوای UX دوستانه را برای رسانه های تعاملی و همچنین پشتیبانی وب مستر پس از راه اندازی مشتری آنلاین خود را ارائه می دهیم. درباره کارهایی که X Factor می تواند برای سازمان شما انجام دهد بیشتر بدانید: https://www.xfactorconsultants.com/