آموزش آشنایی با یادگیری کیو (Q-learning) - آخرین آپدیت

دانلود Introduction to Q-learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: بسیاری از مهندسان مشتاق یادگیری ماشین برای انتقال از درک تئوری یادگیری تقویت‌شده به پیاده‌سازی آن در کد، به‌ویژه هنگام مواجهه با مسائل پیچیده، با چالش روبرو هستند. در این دوره، «آشنایی با یادگیری کیو»، شما پیاده‌سازی هر دو روش یادگیری کیو سنتی و عمیق را برای آموزش عامل‌های هوشمند خواهید آموخت. ابتدا، مبانی Q-learning، تفاوت‌های آن با سایر روش‌های RL مانند SARSA و نقش توابع کیو و جداول کیو (Q-tables) را بررسی خواهید کرد. سپس، نحوه ساخت یک شبکه کیو عمیق (Deep Q-network) را می‌آموزید که مقادیر کیو را با استفاده از شبکه‌های عصبی تخمین زده و از طریق گرادینت نزولی به‌روزرسانی می‌کند. در نهایت، نحوه آموزش شبکه کیو در محیط‌های Gym، استفاده از تجربه بازپخش (Experience Replay) و شبکه‌های هدف (Target Networks) و نظارت بر روند یادگیری را یاد خواهید گرفت. پس از پایان این دوره، مهارت‌ها و دانش لازم از Q-learning را برای ساخت عامل‌های مقیاس‌پذیری که از تجربه می‌آموزند، به دست خواهید آورد.

سرفصل ها و درس ها

نقشه راه یادگیری تقویت‌شده The Reinforcement Learning Blueprint

  • جستجوی قهوه: ساخت مبانی RL - بخش اول The Coffee Quest: Building RL Foundations - Part 1

  • جستجوی قهوه: ساخت مبانی RL - بخش دوم The Coffee Quest: Building RL Foundations - Part 2

  • نبردی میان روش‌های TD - بخش اول A Battle of TD Methods - Part 1

  • نبردی میان روش‌های TD - بخش دوم A Battle of TD Methods - Part 2

از جداول کیو تا شبکه‌های کیو عمیق From Q-tables to Deep Q-networks

  • تسلط بر جداول کیو: مبانی یادگیری کیو Mastering Q-tables: The Basics of Q-learning

  • چرا یادگیری کیو جدولی با بن‌بست مواجه می‌شود Why Tabular Q-learning Hits a Wall

  • مقیاس‌پذیری یادگیری کیو فراتر از جداول Q-learning Scaling beyond Q-tables

  • سه ستون پایداری DQN: اپسیلون-گریدی، تجربه بازپخش و شبکه‌های هدف The Three Pillars of DQN Stability: Epsilon-greedy, Experience Replay, and Target Networks

  • آموزش شبکه: یادگیری کیو با گرادینت نزولی Teaching Your Network: Q-learning with Gradient Descent

آموزش و ارزیابی عامل کیو عمیق Training and Evaluating a Deep Q-agent

  • آماده‌سازی محیط Setting the Stage

  • مکانیسم‌های اصلی یادگیری کیو عمیق The Core Mechanics of Deep Q-learning

  • از یادگیری تا تسلط From Learning to Mastery

نمایش نظرات

آموزش آشنایی با یادگیری کیو (Q-learning)
جزییات دوره
59m
12
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
Marc Harb
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Marc Harb Marc Harb

مارک یک دانشمند ارشد داده با پایه‌ای قوی در مهندسی ارتباطات و کامپیوتر است و مدرک کارشناسی ارشد در زمینه هوش مصنوعی و یادگیری عمیق را از یکی از دانشگاه‌های پیشرو فرانسه دریافت کرده است. مسیر شغلی او بر پایه اشتیاق عمیق به علوم داده و هوش مصنوعی است و تخصص فنی خود را با تفکر نوآورانه ترکیب می‌کند تا راهکارهای اثرگذاری ارائه دهد. او از پتانسیل تحول‌آفرین علوم داده و هوش مصنوعی برای انقلاب در صنایع و بهبود کیفیت زندگی الهام گرفته است. مارک متعهد به کشف بینش‌های معنادار، توسعه سیستم‌های هوشمند و خلق راهکارهای نوآورانه برای مقابله با چالش‌های دنیای واقعی است.