دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش جامع Q-learning (یادگیری کیو) - آخرین آپدیت

دانلود Introduction to Q-learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: بسیاری از مهندسان مشتاق یادگیری ماشین در مسیر تبدیل تئوری‌های یادگیری تقویت‌شده (Reinforcement Learning) به کدهای عملی، به‌ویژه هنگام مواجهه با مسائل پیچیده، با چالش روبرو هستند. در این دوره آموزشی با عنوان «مقدمه‌ای بر Q-learning»، شما پیاده‌سازی روش‌های سنتی و عمیق Q-learning را برای آموزش عامل‌های هوشمند خواهید آموخت. ابتدا با مبانی Q-learning، تفاوت‌های آن با سایر متدهای RL مانند SARSA و نقش توابع Q و جداول Q آشنا می‌شوید. سپس، نحوه ساخت یک شبکه عمیق Q (DQN) را یاد می‌گیرید که با استفاده از شبکه‌های عصبی، مقادیر Q را تخمین زده و از طریق گرادینت نزولی (Gradient Descent) به‌روزرسانی می‌شود. در نهایت، نحوه آموزش شبکه Q در محیط‌های Gym، استفاده از تجربه بازپخش (Experience Replay)، شبکه‌های هدف (Target Networks) و نظارت بر روند یادگیری را فرا خواهید گرفت. در پایان این دوره، شما مهارت و دانش لازم برای ساخت عامل‌های مقیاس‌پذیری را خواهید داشت که قادرند از تجربیات خود بیاموزند.

سرفصل ها و درس ها

نقشه راه یادگیری تقویت‌شده The Reinforcement Learning Blueprint

جستجوی قهوه: ساخت مبانی RL - بخش اول The Coffee Quest: Building RL Foundations - Part 1
جستجوی قهوه: ساخت مبانی RL - بخش دوم The Coffee Quest: Building RL Foundations - Part 2
نبرد متدهای TD - بخش اول A Battle of TD Methods - Part 1
نبرد متدهای TD - بخش دوم A Battle of TD Methods - Part 2

از جداول Q تا شبکه‌های عمیق Q From Q-tables to Deep Q-networks

تسلط بر جداول Q: مبانی Q-learning Mastering Q-tables: The Basics of Q-learning
چرا Q-learning جدولی با محدودیت مواجه می‌شود؟ Why Tabular Q-learning Hits a Wall
مقیاس‌پذیری Q-learning فراتر از جداول Q Q-learning Scaling beyond Q-tables
سه رکن پایداری DQN: اپسیلون-greedy، تجربه بازپخش و شبکه‌های هدف The Three Pillars of DQN Stability: Epsilon-greedy, Experience Replay, and Target Networks
آموزش شبکه: Q-learning با گرادینت نزولی Teaching Your Network: Q-learning with Gradient Descent

آموزش و ارزیابی عامل عمیق Q Training and Evaluating a Deep Q-agent

آماده‌سازی محیط Setting the Stage
مکانیسم‌های اصلی یادگیری عمیق Q The Core Mechanics of Deep Q-learning
از یادگیری تا تسلط کامل From Learning to Mastery

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

جزییات دوره

زمان دوره: 59m

تعداد ویدیو ها: 12

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 3

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Marc Harb

لینک کوتاه این دوره

https://donyad.com/d/80fc4c

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Marc Harb

مارک یک دانشمند ارشد داده با پایه‌ای قوی در مهندسی ارتباطات و کامپیوتر است و مدرک کارشناسی ارشد در زمینه هوش مصنوعی و یادگیری عمیق را از یکی از دانشگاه‌های پیشرو فرانسه دریافت کرده است. مسیر شغلی او بر پایه اشتیاق عمیق به علوم داده و هوش مصنوعی است و تخصص فنی خود را با تفکر نوآورانه ترکیب می‌کند تا راهکارهای اثرگذاری ارائه دهد. او از پتانسیل تحول‌آفرین علوم داده و هوش مصنوعی برای انقلاب در صنایع و بهبود کیفیت زندگی الهام گرفته است. مارک متعهد به کشف بینش‌های معنادار، توسعه سیستم‌های هوشمند و خلق راهکارهای نوآورانه برای مقابله با چالش‌های دنیای واقعی است.

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش جامع Q-learning (یادگیری کیو) - آخرین آپدیت

دانلود Introduction to Q-learning

نقشه راه یادگیری تقویت‌شده The Reinforcement Learning Blueprint

جستجوی قهوه: ساخت مبانی RL - بخش اول The Coffee Quest: Building RL Foundations - Part 1

جستجوی قهوه: ساخت مبانی RL - بخش دوم The Coffee Quest: Building RL Foundations - Part 2

نبرد متدهای TD - بخش اول A Battle of TD Methods - Part 1

نبرد متدهای TD - بخش دوم A Battle of TD Methods - Part 2

از جداول Q تا شبکه‌های عمیق Q From Q-tables to Deep Q-networks

تسلط بر جداول Q: مبانی Q-learning Mastering Q-tables: The Basics of Q-learning

چرا Q-learning جدولی با محدودیت مواجه می‌شود؟ Why Tabular Q-learning Hits a Wall

مقیاس‌پذیری Q-learning فراتر از جداول Q Q-learning Scaling beyond Q-tables

سه رکن پایداری DQN: اپسیلون-greedy، تجربه بازپخش و شبکه‌های هدف The Three Pillars of DQN Stability: Epsilon-greedy, Experience Replay, and Target Networks

آموزش شبکه: Q-learning با گرادینت نزولی Teaching Your Network: Q-learning with Gradient Descent