دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش آشنایی با یادگیری کیو (Q-learning) - آخرین آپدیت

دانلود Introduction to Q-learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: بسیاری از مهندسان مشتاق یادگیری ماشین برای انتقال از درک تئوری یادگیری تقویت‌شده به پیاده‌سازی آن در کد، به‌ویژه هنگام مواجهه با مسائل پیچیده، با چالش روبرو هستند. در این دوره، «آشنایی با یادگیری کیو»، شما پیاده‌سازی هر دو روش یادگیری کیو سنتی و عمیق را برای آموزش عامل‌های هوشمند خواهید آموخت. ابتدا، مبانی Q-learning، تفاوت‌های آن با سایر روش‌های RL مانند SARSA و نقش توابع کیو و جداول کیو (Q-tables) را بررسی خواهید کرد. سپس، نحوه ساخت یک شبکه کیو عمیق (Deep Q-network) را می‌آموزید که مقادیر کیو را با استفاده از شبکه‌های عصبی تخمین زده و از طریق گرادینت نزولی به‌روزرسانی می‌کند. در نهایت، نحوه آموزش شبکه کیو در محیط‌های Gym، استفاده از تجربه بازپخش (Experience Replay) و شبکه‌های هدف (Target Networks) و نظارت بر روند یادگیری را یاد خواهید گرفت. پس از پایان این دوره، مهارت‌ها و دانش لازم از Q-learning را برای ساخت عامل‌های مقیاس‌پذیری که از تجربه می‌آموزند، به دست خواهید آورد.

سرفصل ها و درس ها

نقشه راه یادگیری تقویت‌شده The Reinforcement Learning Blueprint

جستجوی قهوه: ساخت مبانی RL - بخش اول The Coffee Quest: Building RL Foundations - Part 1
جستجوی قهوه: ساخت مبانی RL - بخش دوم The Coffee Quest: Building RL Foundations - Part 2
نبردی میان روش‌های TD - بخش اول A Battle of TD Methods - Part 1
نبردی میان روش‌های TD - بخش دوم A Battle of TD Methods - Part 2

از جداول کیو تا شبکه‌های کیو عمیق From Q-tables to Deep Q-networks

تسلط بر جداول کیو: مبانی یادگیری کیو Mastering Q-tables: The Basics of Q-learning
چرا یادگیری کیو جدولی با بن‌بست مواجه می‌شود Why Tabular Q-learning Hits a Wall
مقیاس‌پذیری یادگیری کیو فراتر از جداول Q-learning Scaling beyond Q-tables
سه ستون پایداری DQN: اپسیلون-گریدی، تجربه بازپخش و شبکه‌های هدف The Three Pillars of DQN Stability: Epsilon-greedy, Experience Replay, and Target Networks
آموزش شبکه: یادگیری کیو با گرادینت نزولی Teaching Your Network: Q-learning with Gradient Descent

آموزش و ارزیابی عامل کیو عمیق Training and Evaluating a Deep Q-agent

آماده‌سازی محیط Setting the Stage
مکانیسم‌های اصلی یادگیری کیو عمیق The Core Mechanics of Deep Q-learning
از یادگیری تا تسلط From Learning to Mastery

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش آشنایی با یادگیری کیو (Q-learning)

جزییات دوره

زمان دوره: 59m

تعداد ویدیو ها: 12

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 3

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Marc Harb

لینک کوتاه این دوره

https://donyad.com/d/14cfb5

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Marc Harb

مارک یک دانشمند ارشد داده با پایه‌ای قوی در مهندسی ارتباطات و کامپیوتر است و مدرک کارشناسی ارشد در زمینه هوش مصنوعی و یادگیری عمیق را از یکی از دانشگاه‌های پیشرو فرانسه دریافت کرده است. مسیر شغلی او بر پایه اشتیاق عمیق به علوم داده و هوش مصنوعی است و تخصص فنی خود را با تفکر نوآورانه ترکیب می‌کند تا راهکارهای اثرگذاری ارائه دهد. او از پتانسیل تحول‌آفرین علوم داده و هوش مصنوعی برای انقلاب در صنایع و بهبود کیفیت زندگی الهام گرفته است. مارک متعهد به کشف بینش‌های معنادار، توسعه سیستم‌های هوشمند و خلق راهکارهای نوآورانه برای مقابله با چالش‌های دنیای واقعی است.

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش آشنایی با یادگیری کیو (Q-learning) - آخرین آپدیت

دانلود Introduction to Q-learning

نقشه راه یادگیری تقویت‌شده The Reinforcement Learning Blueprint

جستجوی قهوه: ساخت مبانی RL - بخش اول The Coffee Quest: Building RL Foundations - Part 1

جستجوی قهوه: ساخت مبانی RL - بخش دوم The Coffee Quest: Building RL Foundations - Part 2

نبردی میان روش‌های TD - بخش اول A Battle of TD Methods - Part 1

نبردی میان روش‌های TD - بخش دوم A Battle of TD Methods - Part 2

از جداول کیو تا شبکه‌های کیو عمیق From Q-tables to Deep Q-networks

تسلط بر جداول کیو: مبانی یادگیری کیو Mastering Q-tables: The Basics of Q-learning

چرا یادگیری کیو جدولی با بن‌بست مواجه می‌شود Why Tabular Q-learning Hits a Wall

مقیاس‌پذیری یادگیری کیو فراتر از جداول Q-learning Scaling beyond Q-tables

سه ستون پایداری DQN: اپسیلون-گریدی، تجربه بازپخش و شبکه‌های هدف The Three Pillars of DQN Stability: Epsilon-greedy, Experience Replay, and Target Networks

آموزش شبکه: یادگیری کیو با گرادینت نزولی Teaching Your Network: Q-learning with Gradient Descent