آموزش روش‌های مونت کارلو - آخرین آپدیت

دانلود Monte Carlo Methods

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: روش‌های مونت کارلو ممکن است انتزاعی به نظر برسند و متخصصان را در مورد نحوه تبدیل بازده‌های اپیزودیک به تخمین‌های ارزشی موثر، سیاست‌ها و شبکه‌های قابل آموزش دچار تردید کنند. در این دوره آموزشی «روش‌های مونت کارلو»، شما یاد می‌گیرید که عامل‌های یادگیری تقویت‌شده مبتنی بر مونت کارلو را به صورت کامل (End-to-End) بسازید و ارزیابی کنید. ابتدا، پیش‌بینی مونت کارلو با نمونه‌برداری اپیزودیک و تفاوت‌های بین تخمین‌های 'اولین بازدید' (First-visit) و 'هر بازدید' (Every-visit) را بررسی خواهید کرد. سپس، کنترل مونت کارلو را با استفاده از سیاست‌های ε-greedy برای استخراج رفتار بهینه از تجربه کشف می‌کنید. در نهایت، نحوه پیاده‌سازی الگوریتم گرادینت سیاست REINFORCE در PyTorch و ارزیابی عملکرد آن روی محیط CartPole را خواهید آموخت. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم از روش‌های مونت کارلو در یادگیری تقویت‌شده را برای طراحی، پیاده‌سازی و ارزیابی عامل‌های پیش‌بینی، کنترل و گرادینت سیاست به دست خواهید آورد.

سرفصل ها و درس ها

مقدمه‌ای بر روش‌های مونت کارلو Introduction to Monte Carlo Methods

  • مقدمه Introduction

  • شبیه‌سازی مونت کارلو در بازی بلک‌جک Blackjack Monte Carlo Simulation

کنترل‌های مونت کارلو Monte Carlo Controls

  • آشنایی با کنترل‌ها Introducing Controls

  • کنترل مونت کارلو ε-Soft در بلک‌جک ε-Soft Monte Carlo Control on Blackjack

گرادینت‌های سیاست و REINFORCE Policy Gradients & REINFORCE

  • الگوریتم REINFORCE The REINFORCE Algorithm

  • پیاده‌سازی عملی REINFORCE REINFORCE in Action

نمایش نظرات

آموزش روش‌های مونت کارلو
جزییات دوره
34m
6
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Anthony Alampi Anthony Alampi

من آنتونی آلامپی هستم ، یک طراح و توسعه دهنده تعاملی ساکن آستین ، تگزاس. من یک توسعه دهنده حرفه ای بازی های ویدیویی و صاحب فعلی شرکت طراحی وب با بیش از 15 سال تجربه برنامه نویسی و بیش از 7 سال تجربه طراحی هستم. طراحی کاربر محور علاقه من است و معتقدم وقتی کاربران در اولویت قرار می گیرند ، دوباره برمی گردند! نمونه کارهای شخصی من را می توانید در این آدرس مشاهده کنید: https://www.anthonyalampi.com/درباره شرکت من: مشاوران X Factor یک شرکت طراحی دیجیتال است که در Round Rock ، تگزاس مستقر است. ما در ایجاد وب سایت های تمیز ، کاربر پسند و آرم های چشم نواز ، رسانه های دیجیتال و سایر مواد بازاریابی برای طیف گسترده ای از صنایع تخصص داریم. ما همچنین خدمات اصلی نوشتن محتوای UX دوستانه را برای رسانه های تعاملی و همچنین پشتیبانی وب مستر پس از راه اندازی مشتری آنلاین خود را ارائه می دهیم. درباره کارهایی که X Factor می تواند برای سازمان شما انجام دهد بیشتر بدانید: https://www.xfactorconsultants.com/