دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش روش‌های Actor-Critic و تخمین مزیت (Advantage Estimation) - آخرین آپدیت

دانلود Actor-critic Methods and Advantage Estimation

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: روش‌های Actor-Critic و تخمین مزیت، متدهایی قدرتمند و پیشرفته برای آموزش مدل‌های یادگیری ماشین هستند که می‌توانند مسائل پیچیده و وابسته به زمان را، که شبکه‌های عصبی عمیق (DNN) ساده قادر به حل آن‌ها نیستند، مدیریت کنند. در این دوره آموزشی، شما یاد می‌گیرید که این مدل‌ها را درک کرده، آموزش دهید و پیاده‌سازی کنید. ابتدا با متد Actor-Critic آشنا می‌شوید و نحوه عملکرد و تفاوت آن با سایر روش‌های یادگیری تقویت‌شده (RL) را بررسی می‌کنید. سپس، مفهوم تخمین مزیت (Advantage Estimation) و کاربرد آن در آموزش سیاست‌های متوازن‌تر و سازگارتر را می‌آموزید. در نهایت، نحوه پیاده‌سازی متد Actor-Critic را در زبان پایتون یاد گرفته و نتایج تکنیک‌های مختلف RL را با یکدیگر مقایسه خواهید کرد. پس از پایان این دوره، شما مهارت و دانش لازم در زمینه Actor-Critic و تخمین مزیت را برای توسعه، نگهداری و بهبود مدل‌های پیشرفته یادگیری تقویت‌شده کسب خواهید کرد.

سرفصل ها و درس ها

درک روش‌های Actor-Critic و تخمین مزیت Understanding Actor-critic Methods and Advantage Estimation

درک روش‌های Actor-Critic Understanding Actor-critic Methods
درک گرادیان‌های سیاست (Policy Gradients) Understanding Policy Gradients
درک تخمین مزیت (Advantage Estimation) Understanding Advantage Estimation
مزایا و معایب متد Actor-Critic Advantages and Disadvantages of Actor-critic Method

پیاده‌سازی عامل Advantage Actor-Critic در پایتون Implementing an Advantage Actor-critic Agent in Python

راه‌اندازی محیط یادگیری تقویت‌شده با پایتون و ژوپیتر نوت‌بوک Setting up an Environment for Reinforcement Learning Using Python and Jupyter Notebooks
پیاده‌سازی Runner و آموزش مدل Implementing the Runner and Training the Model
پیاده‌سازی متد Actor-Critic در ورکشاپ RL ژوپیتر نوت‌بوک Implementing Actor-critic Method in the Jupyter Notebook RL Workshop
تنظیم هایپرپارامترها Tuning Hyperparameters

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش روش‌های Actor-Critic و تخمین مزیت (Advantage Estimation)

جزییات دوره

زمان دوره: 1h 0m

تعداد ویدیو ها: 8

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 1

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Daniel Stern

لینک کوتاه این دوره

https://donyad.com/d/7beb13

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Daniel Stern

Daniel Stern یک رمزگذار ، توسعه دهنده وب و علاقه مند به برنامه نویسی از تورنتو ، انتاریو است ، جایی که او به عنوان یک توسعه دهنده و طراح مستقل کار می کند. دانیل از روزهای برقراری ارتباط تلفنی با فناوری های وب کار می کند و به ویژه علاقه زیادی به جاوا اسکریپت ، CSS ، آنگولار ، React و TypeScript دارد. در طول کار خود به عنوان یک توسعه دهنده منبع باز ، وی بسیاری از ابزارهای وب با استانداردهای جامعه از جمله Angular Audio و Range.CSS را ایجاد کرده است. ابزار وی ، Range.CSS ، در مقاله مهمان در CSS-Tricks.com و در CSS Weekly به نمایش در آمد. دانیل همچنین دانش خود را از طریق سخنرانی به اشتراک می گذارد ، مانند لندن ، انگلیس در Full Stack Conf 2014 که در آن سخنرانی در مورد بهترین روش های صوتی وب و Angular را ارائه داد. فیلم های سخنرانی دانیل در نشریاتی مانند JavaScript Weekly به نمایش در آمده است. دانیل در تورنتو ، انتاریو زندگی می کند و از ساخت موسیقی الکترونیکی و خواندن Game of Thrones در موارد نادر که کد نویسی نمی کند ، لذت می برد.

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش روش‌های Actor-Critic و تخمین مزیت (Advantage Estimation) - آخرین آپدیت

دانلود Actor-critic Methods and Advantage Estimation

درک روش‌های Actor-Critic و تخمین مزیت Understanding Actor-critic Methods and Advantage Estimation

درک روش‌های Actor-Critic Understanding Actor-critic Methods

درک گرادیان‌های سیاست (Policy Gradients) Understanding Policy Gradients

درک تخمین مزیت (Advantage Estimation) Understanding Advantage Estimation

مزایا و معایب متد Actor-Critic Advantages and Disadvantages of Actor-critic Method

پیاده‌سازی عامل Advantage Actor-Critic در پایتون Implementing an Advantage Actor-critic Agent in Python

راه‌اندازی محیط یادگیری تقویت‌شده با پایتون و ژوپیتر نوت‌بوک Setting up an Environment for Reinforcement Learning Using Python and Jupyter Notebooks

پیاده‌سازی Runner و آموزش مدل Implementing the Runner and Training the Model

پیاده‌سازی متد Actor-Critic در ورکشاپ RL ژوپیتر نوت‌بوک Implementing Actor-critic Method in the Jupyter Notebook RL Workshop

تنظیم هایپرپارامترها Tuning Hyperparameters