🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش یادگیری تقویتی عمیق با پایتون ۲۰۲۵
- آخرین آپدیت
دانلود Deep Reinforcement Learning using python 2025
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
آموزش کامل یادگیری تقویتی: معاملهگری سهام | بازیها
درک عمیق یادگیری تقویتی و کاربردهای آن. شبکهی عصبی خودتان را بسازید. پیادهسازی 5 پروژهی مختلف یادگیری تقویتی. راههای زیادی برای بهبود ربات خود بیاموزید.
پیشنیازها:
Numpy
Matplotlib
Pandas
گرادیان کاهشی
برنامهنویسی شیءگرا
درک کلی از یادگیری عمیق
به یادگیری تقویتی عمیق با استفاده از پایتون خوش آمدید!
آیا تا به حال از خود پرسیدهاید که چگونه رباتهای هوشمند ساخته میشوند؟
یادگیری تقویتی با ساخت رباتهای هوشمند مرتبط است. این یک زیرشاخه از یادگیری ماشین است که در سالهای اخیر به نتایج چشمگیری دست یافته است، به طوری که اکنون میتوانیم رباتهایی بسازیم که میتوانند انسان را در بازیهای بسیار سخت مانند بازی آلفا-گو و بازی شطرنج شکست دهند.
یادگیری تقویتی عمیق به معنای ادغام زمینههای یادگیری تقویتی و یادگیری عمیق است. یادگیری عمیق نیز یک زیرشاخه از یادگیری ماشین است که از الگوریتمهای ویژهای به نام شبکههای عصبی استفاده میکند.
در این دوره، ما در مورد یادگیری تقویتی عمیق صحبت خواهیم کرد و به موارد زیر خواهیم پرداخت:
بخش 1: مقدمهای بر یادگیری تقویتی عمیق
در این بخش، تمام مبانی یادگیری تقویتی عمیق را بررسی خواهیم کرد. این موارد شامل سیاست (Policy)، تابع ارزش (Value function)، تابع Q و شبکهی عصبی است.
بخش 2: راهاندازی محیط
در این بخش، یاد خواهیم گرفت که چگونه محیط مجازی خود را ایجاد کرده و تمام بستههای مورد نیاز را نصب کنیم.
بخش 3: بازی Grid World و یادگیری عمیق Q
در این بخش، یاد خواهیم گرفت که چگونه اولین ربات هوشمند خود را برای حل بازی Grid World بسازیم.
در اینجا یاد خواهیم گرفت که چگونه شبکهی عصبی خود را بسازیم و آموزش دهیم و چگونه اکتشاف و بهرهبرداری را انجام دهیم.
بخش 4: بازی Mountain Car و یادگیری عمیق Q
در این بخش، سعی خواهیم کرد رباتی بسازیم تا بازی Mountain Car را حل کند.
در اینجا یاد خواهیم گرفت که چگونه ماژول ICM و ماژول RND را برای حل مشکل پاداش پراکنده (sparse reward) در بازی Mountain Car بسازیم.
بخش 5: بازی Flappy Bird و یادگیری عمیق Q
در این بخش، یاد خواهیم گرفت که چگونه یک ربات هوشمند برای حل بازی Flappy Bird بسازیم.
در اینجا یاد خواهیم گرفت که چگونه انواع مختلف شبکهی Q مانند شبکهی Q دوئل، شبکهی Q اولویتبندی شده و شبکهی Q دو مرحلهای را بسازیم.
بخش 6: بازی Ms Pacman و یادگیری عمیق Q
در این بخش، یاد خواهیم گرفت که چگونه یک ربات هوشمند برای حل بازی Ms Pacman بسازیم.
در اینجا یاد خواهیم گرفت که چگونه انواع دیگری از شبکهی Q مانند شبکهی Q نویزی، شبکهی Q دوبل و شبکهی Q n-مرحلهای را بسازیم.
بخش 7: معاملهگری سهام و یادگیری عمیق Q
در این بخش، یاد خواهیم گرفت که چگونه یک ربات هوشمند برای معاملهگری سهام بسازیم.
سرفصل ها و درس ها
مقدمهای بر یادگیری تقویتی عمیق
An Introduction to Deep Reinforcement Learning
یادگیری تقویتی چیست؟
What is reinforcement learning?
آزمون درس 1
Quiz for lecture 1
سیاست، تابع ارزش و تابع Q
Policy , Value function and Q function
آزمون درس 2
Lecture 2 quiz
شبکههای عصبی چیستند؟
What are Neural Networks?
آزمون درس 3
Lecture 3 quiz
تابع Q بهینه
Optimal Q function
آزمون درس 4
Lecture 4 quiz
راهاندازی محیط
Setting up the environment
ایجاد محیط Anaconda
creating anaconda environment
بسته Gym
Gym package
آزمون درس 5
Lecture 5 quiz
نحوه اجرای کد هر بخش
How to run the code of each section
بازی دنیای جدولی و یادگیری عمیق Q
Grid World Game & Deep Q-Learning
بازی دنیای جدولی چیست؟
What is Grid World Game?
آزمون درس 7
Lecture 7 quiz
نحوه استفاده از محیط دنیای جدولی
How to use Grid World environment ?
آزمون درس 8
Lecture 8 quiz
چگونه شبکه خود را بسازیم؟
How to build your network ?
آزمون درس 9
Lecture 9 quiz
چگونه اولین شبکه Q خود را با استفاده از Pytorch بسازیم؟
How to Build your first Q network using pytorch ?
آزمون درس 10
Lecture 10 quiz
چگونه شبکه عصبی خود را آموزش دهیم؟
How to make your neural network learn ?
آزمون درس 11
Lecture 11 quiz
اکتشاف و بهرهبرداری با استفاده از اپسیلون حریصانه
Exploration & Exploitation using epsilon greedy
آموزش شبکه عصبی با استفاده از Pytorch قسمت 1
Training your neural network using pytorch part1
آزمون درس 13
Lecture 13 quiz
آموزش شبکه عصبی با استفاده از Pytorch قسمت 2
Training your neural network using pytorch part2
آموزش دستهای
Batch training
کد پایتون آموزش روی دستهها
train on batches python code
آزمون درس 15
Lecture 15 quiz
معیار پاداش
reward metric
آزمون درس 17
Lecture 17 quiz
شبکه هدف
Target nework
کد پایتون آموزش عامل با شبکه هدف
train your agent with target network python code
آزمون درس 19
Lecture 19 quiz
بازی ماشین کوهستان و یادگیری عمیق Q
Mountain Car game & Deep Q-Learning
ماشین کوهستان در پایتون
Mountain car in python
آزمون درس 20
Lecture 20 quiz
شبکه دینامیک
Dynamics network
آزمون درس 20
Lecture 20 quiz
استراتژی اپسیلون حریصانه بازی ماشین کوهستان در پایتون
Epsilon Greedy strategy mountain Car game in python
شبکه دینامیک با پایتون
Dynamics Network with python
توزیع گاوسی چند متغیره
Multi variate gaussian distribution
آزمون درس 21
Lecture 21 quiz
توزیع گاوسی چند متغیره با پایتون
Multivariate gaussian distribution with python
استراتژی اکتشاف مبتنی بر مدل با ماشین کوهستان در پایتون
Model based exploration strategy with mountain car in python
ماژول ICM چیست؟
What is ICM module ?
آزمون درس 27
Lecture 27 quiz
شبکه فیلتر
Filter network
آزمون درس 28
Lecture 28 quiz
ساخت کد پایتون شبکه فیلتر
Building Filter net python code
شبکه معکوس
Inverse network
آزمون درس 30
Lecture 30 quiz
ساخت کد پایتون شبکه معکوس
Building Inverse net python code
آزمون درس 31
Lecture 31 quiz
شبکه پیشرو
Forward network
آزمون درس 32
Lecture 32 quiz
ساخت کد پایتون شبکه پیشرو
Building Forward network python code
آزمون درس 33
Lecture 33 quiz
ساخت کد پایتون شبکه Q عامل و شبکه Q هدف
Building Agent Q network & Target Q network python code
آموزش شبکه Q با ICM
Training Q network with ICM
آموزش کد پایتون شبکه Q عامل با ICM
Training Agent Q network with ICM python code
آزمون درس 36
Lecture 36 quiz
ماژول RND چیست؟
What is RND module?
آزمون درس 37
Lecture 37 quiz
ساخت کد پایتون شبکه P و شبکه T
Building P net & T net python code
آزمون درس 38
Lecture 38 quiz
آموزش شبکه Q عامل با ماژول RND
Training Agent Q network with RND module
بازی ف্লাپی برد و یادگیری عمیق Q
Flappy bird game & Deep Q-learning
بازی ف্লাپی برد
Flappy bird game
کد پایتون بازی ف্লাپی برد
Flappy bird game python code
آزمون
quiz
ساخت شبکه کانولوشن Q
Building convolution Q network
آزمون
quiz
کد پایتون شبکه Q کانولوشن با رویکرد اپسیلون حریصانه
conv Q network with epsilon greedy approach python code
شبکه Q دو مرحلهای
2-steps Q network
کد پایتون شبکه Q دو مرحلهای
2-steps Q network python code
بافر تجربه با اولویت
Prioritized Experience Replay buffer
Expert ar Kaggle نام من ریاد است. من یکی از کارشناسان سایت Kaggle و متخصص در یادگیری ماشینی، Deeplearning و زبان برنامه نویسی پایتون هستم که قبلاً در دو مسابقه Kaggle برنده شدم، اولی "MOA" و دومی petfinder. من همچنین در بحث ها و کدنویسی متخصص هستم. من همچنین با برنامه های اندروید و همچنین دستگاه های جاسازی تجربه دارم.
نمایش نظرات