آموزش جامع Q-learning (یادگیری کیو) - آخرین آپدیت

دانلود Introduction to Q-learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: بسیاری از مهندسان مشتاق یادگیری ماشین در مسیر تبدیل تئوری‌های یادگیری تقویت‌شده (Reinforcement Learning) به کدهای عملی، به‌ویژه هنگام مواجهه با مسائل پیچیده، با چالش روبرو هستند. در این دوره آموزشی با عنوان «مقدمه‌ای بر Q-learning»، شما پیاده‌سازی روش‌های سنتی و عمیق Q-learning را برای آموزش عامل‌های هوشمند خواهید آموخت. ابتدا با مبانی Q-learning، تفاوت‌های آن با سایر متدهای RL مانند SARSA و نقش توابع Q و جداول Q آشنا می‌شوید. سپس، نحوه ساخت یک شبکه عمیق Q (DQN) را یاد می‌گیرید که با استفاده از شبکه‌های عصبی، مقادیر Q را تخمین زده و از طریق گرادینت نزولی (Gradient Descent) به‌روزرسانی می‌شود. در نهایت، نحوه آموزش شبکه Q در محیط‌های Gym، استفاده از تجربه بازپخش (Experience Replay)، شبکه‌های هدف (Target Networks) و نظارت بر روند یادگیری را فرا خواهید گرفت. در پایان این دوره، شما مهارت و دانش لازم برای ساخت عامل‌های مقیاس‌پذیری را خواهید داشت که قادرند از تجربیات خود بیاموزند.

سرفصل ها و درس ها

نقشه راه یادگیری تقویت‌شده The Reinforcement Learning Blueprint

  • جستجوی قهوه: ساخت مبانی RL - بخش اول The Coffee Quest: Building RL Foundations - Part 1

  • جستجوی قهوه: ساخت مبانی RL - بخش دوم The Coffee Quest: Building RL Foundations - Part 2

  • نبرد متدهای TD - بخش اول A Battle of TD Methods - Part 1

  • نبرد متدهای TD - بخش دوم A Battle of TD Methods - Part 2

از جداول Q تا شبکه‌های عمیق Q From Q-tables to Deep Q-networks

  • تسلط بر جداول Q: مبانی Q-learning Mastering Q-tables: The Basics of Q-learning

  • چرا Q-learning جدولی با محدودیت مواجه می‌شود؟ Why Tabular Q-learning Hits a Wall

  • مقیاس‌پذیری Q-learning فراتر از جداول Q Q-learning Scaling beyond Q-tables

  • سه رکن پایداری DQN: اپسیلون-greedy، تجربه بازپخش و شبکه‌های هدف The Three Pillars of DQN Stability: Epsilon-greedy, Experience Replay, and Target Networks

  • آموزش شبکه: Q-learning با گرادینت نزولی Teaching Your Network: Q-learning with Gradient Descent

آموزش و ارزیابی عامل عمیق Q Training and Evaluating a Deep Q-agent

  • آماده‌سازی محیط Setting the Stage

  • مکانیسم‌های اصلی یادگیری عمیق Q The Core Mechanics of Deep Q-learning

  • از یادگیری تا تسلط کامل From Learning to Mastery

نمایش نظرات

آموزش جامع Q-learning (یادگیری کیو)
جزییات دوره
59m
12
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
Marc Harb
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Marc Harb Marc Harb

مارک یک دانشمند ارشد داده با پایه‌ای قوی در مهندسی ارتباطات و کامپیوتر است و مدرک کارشناسی ارشد در زمینه هوش مصنوعی و یادگیری عمیق را از یکی از دانشگاه‌های پیشرو فرانسه دریافت کرده است. مسیر شغلی او بر پایه اشتیاق عمیق به علوم داده و هوش مصنوعی است و تخصص فنی خود را با تفکر نوآورانه ترکیب می‌کند تا راهکارهای اثرگذاری ارائه دهد. او از پتانسیل تحول‌آفرین علوم داده و هوش مصنوعی برای انقلاب در صنایع و بهبود کیفیت زندگی الهام گرفته است. مارک متعهد به کشف بینش‌های معنادار، توسعه سیستم‌های هوشمند و خلق راهکارهای نوآورانه برای مقابله با چالش‌های دنیای واقعی است.