آموزش روش‌های Actor-Critic و تخمین مزیت (Advantage Estimation) - آخرین آپدیت

دانلود Actor-critic Methods and Advantage Estimation

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: روش‌های Actor-Critic و تخمین مزیت، متدهایی قدرتمند و پیشرفته برای آموزش مدل‌های یادگیری ماشین هستند که می‌توانند مسائل پیچیده و وابسته به زمان را، که شبکه‌های عصبی عمیق (DNN) ساده قادر به حل آن‌ها نیستند، مدیریت کنند. در این دوره آموزشی، شما یاد می‌گیرید که این مدل‌ها را درک کرده، آموزش دهید و پیاده‌سازی کنید. ابتدا با متد Actor-Critic آشنا می‌شوید و نحوه عملکرد و تفاوت آن با سایر روش‌های یادگیری تقویت‌شده (RL) را بررسی می‌کنید. سپس، مفهوم تخمین مزیت (Advantage Estimation) و کاربرد آن در آموزش سیاست‌های متوازن‌تر و سازگارتر را می‌آموزید. در نهایت، نحوه پیاده‌سازی متد Actor-Critic را در زبان پایتون یاد گرفته و نتایج تکنیک‌های مختلف RL را با یکدیگر مقایسه خواهید کرد. پس از پایان این دوره، شما مهارت و دانش لازم در زمینه Actor-Critic و تخمین مزیت را برای توسعه، نگهداری و بهبود مدل‌های پیشرفته یادگیری تقویت‌شده کسب خواهید کرد.

سرفصل ها و درس ها

درک روش‌های Actor-Critic و تخمین مزیت Understanding Actor-critic Methods and Advantage Estimation

  • درک روش‌های Actor-Critic Understanding Actor-critic Methods

  • درک گرادیان‌های سیاست (Policy Gradients) Understanding Policy Gradients

  • درک تخمین مزیت (Advantage Estimation) Understanding Advantage Estimation

  • مزایا و معایب متد Actor-Critic Advantages and Disadvantages of Actor-critic Method

پیاده‌سازی عامل Advantage Actor-Critic در پایتون Implementing an Advantage Actor-critic Agent in Python

  • راه‌اندازی محیط یادگیری تقویت‌شده با پایتون و ژوپیتر نوت‌بوک Setting up an Environment for Reinforcement Learning Using Python and Jupyter Notebooks

  • پیاده‌سازی Runner و آموزش مدل Implementing the Runner and Training the Model

  • پیاده‌سازی متد Actor-Critic در ورکشاپ RL ژوپیتر نوت‌بوک Implementing Actor-critic Method in the Jupyter Notebook RL Workshop

  • تنظیم هایپرپارامترها Tuning Hyperparameters

نمایش نظرات

آموزش روش‌های Actor-Critic و تخمین مزیت (Advantage Estimation)
جزییات دوره
1h 0m
8
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
1
از 5
دارد
دارد
دارد
Daniel Stern
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Daniel Stern Daniel Stern

Daniel Stern یک رمزگذار ، توسعه دهنده وب و علاقه مند به برنامه نویسی از تورنتو ، انتاریو است ، جایی که او به عنوان یک توسعه دهنده و طراح مستقل کار می کند. دانیل از روزهای برقراری ارتباط تلفنی با فناوری های وب کار می کند و به ویژه علاقه زیادی به جاوا اسکریپت ، CSS ، آنگولار ، React و TypeScript دارد. در طول کار خود به عنوان یک توسعه دهنده منبع باز ، وی بسیاری از ابزارهای وب با استانداردهای جامعه از جمله Angular Audio و Range.CSS را ایجاد کرده است. ابزار وی ، Range.CSS ، در مقاله مهمان در CSS-Tricks.com و در CSS Weekly به نمایش در آمد. دانیل همچنین دانش خود را از طریق سخنرانی به اشتراک می گذارد ، مانند لندن ، انگلیس در Full Stack Conf 2014 که در آن سخنرانی در مورد بهترین روش های صوتی وب و Angular را ارائه داد. فیلم های سخنرانی دانیل در نشریاتی مانند JavaScript Weekly به نمایش در آمده است. دانیل در تورنتو ، انتاریو زندگی می کند و از ساخت موسیقی الکترونیکی و خواندن Game of Thrones در موارد نادر که کد نویسی نمی کند ، لذت می برد.