آموزش یادگیری تقویتی عمیق با پایتون ۲۰۲۵ - آخرین آپدیت

دانلود Deep Reinforcement Learning using python 2025

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

آموزش کامل یادگیری تقویتی: معامله‌گری سهام | بازی‌ها

درک عمیق یادگیری تقویتی و کاربردهای آن. شبکه‌ی عصبی خودتان را بسازید. پیاده‌سازی 5 پروژه‌ی مختلف یادگیری تقویتی. راه‌های زیادی برای بهبود ربات خود بیاموزید.

پیش‌نیازها:

  • Numpy
  • Matplotlib
  • Pandas
  • گرادیان کاهشی
  • برنامه‌نویسی شیءگرا
  • درک کلی از یادگیری عمیق

به یادگیری تقویتی عمیق با استفاده از پایتون خوش آمدید!

آیا تا به حال از خود پرسیده‌اید که چگونه ربات‌های هوشمند ساخته می‌شوند؟

یادگیری تقویتی با ساخت ربات‌های هوشمند مرتبط است. این یک زیرشاخه از یادگیری ماشین است که در سال‌های اخیر به نتایج چشمگیری دست یافته است، به طوری که اکنون می‌توانیم ربات‌هایی بسازیم که می‌توانند انسان را در بازی‌های بسیار سخت مانند بازی آلفا-گو و بازی شطرنج شکست دهند.

یادگیری تقویتی عمیق به معنای ادغام زمینه‌های یادگیری تقویتی و یادگیری عمیق است. یادگیری عمیق نیز یک زیرشاخه از یادگیری ماشین است که از الگوریتم‌های ویژه‌ای به نام شبکه‌های عصبی استفاده می‌کند.

در این دوره، ما در مورد یادگیری تقویتی عمیق صحبت خواهیم کرد و به موارد زیر خواهیم پرداخت:

  • بخش 1: مقدمه‌ای بر یادگیری تقویتی عمیق

    در این بخش، تمام مبانی یادگیری تقویتی عمیق را بررسی خواهیم کرد. این موارد شامل سیاست (Policy)، تابع ارزش (Value function)، تابع Q و شبکه‌ی عصبی است.

  • بخش 2: راه‌اندازی محیط

    در این بخش، یاد خواهیم گرفت که چگونه محیط مجازی خود را ایجاد کرده و تمام بسته‌های مورد نیاز را نصب کنیم.

  • بخش 3: بازی Grid World و یادگیری عمیق Q

    در این بخش، یاد خواهیم گرفت که چگونه اولین ربات هوشمند خود را برای حل بازی Grid World بسازیم.

    در اینجا یاد خواهیم گرفت که چگونه شبکه‌ی عصبی خود را بسازیم و آموزش دهیم و چگونه اکتشاف و بهره‌برداری را انجام دهیم.

  • بخش 4: بازی Mountain Car و یادگیری عمیق Q

    در این بخش، سعی خواهیم کرد رباتی بسازیم تا بازی Mountain Car را حل کند.

    در اینجا یاد خواهیم گرفت که چگونه ماژول ICM و ماژول RND را برای حل مشکل پاداش پراکنده (sparse reward) در بازی Mountain Car بسازیم.

  • بخش 5: بازی Flappy Bird و یادگیری عمیق Q

    در این بخش، یاد خواهیم گرفت که چگونه یک ربات هوشمند برای حل بازی Flappy Bird بسازیم.

    در اینجا یاد خواهیم گرفت که چگونه انواع مختلف شبکه‌ی Q مانند شبکه‌ی Q دوئل، شبکه‌ی Q اولویت‌بندی شده و شبکه‌ی Q دو مرحله‌ای را بسازیم.

  • بخش 6: بازی Ms Pacman و یادگیری عمیق Q

    در این بخش، یاد خواهیم گرفت که چگونه یک ربات هوشمند برای حل بازی Ms Pacman بسازیم.

    در اینجا یاد خواهیم گرفت که چگونه انواع دیگری از شبکه‌ی Q مانند شبکه‌ی Q نویزی، شبکه‌ی Q دوبل و شبکه‌ی Q n-مرحله‌ای را بسازیم.

  • بخش 7: معامله‌گری سهام و یادگیری عمیق Q

    در این بخش، یاد خواهیم گرفت که چگونه یک ربات هوشمند برای معامله‌گری سهام بسازیم.


سرفصل ها و درس ها

مقدمه‌ای بر یادگیری تقویتی عمیق An Introduction to Deep Reinforcement Learning

  • یادگیری تقویتی چیست؟ What is reinforcement learning?

  • آزمون درس 1 Quiz for lecture 1

  • سیاست، تابع ارزش و تابع Q Policy , Value function and Q function

  • آزمون درس 2 Lecture 2 quiz

  • شبکه‌های عصبی چیستند؟ What are Neural Networks?

  • آزمون درس 3 Lecture 3 quiz

  • تابع Q بهینه Optimal Q function

  • آزمون درس 4 Lecture 4 quiz

راه‌اندازی محیط Setting up the environment

  • ایجاد محیط Anaconda creating anaconda environment

  • بسته Gym Gym package

  • آزمون درس 5 Lecture 5 quiz

  • نحوه اجرای کد هر بخش How to run the code of each section

بازی دنیای جدولی و یادگیری عمیق Q Grid World Game & Deep Q-Learning

  • بازی دنیای جدولی چیست؟ What is Grid World Game?

  • آزمون درس 7 Lecture 7 quiz

  • نحوه استفاده از محیط دنیای جدولی How to use Grid World environment ?

  • آزمون درس 8 Lecture 8 quiz

  • چگونه شبکه خود را بسازیم؟ How to build your network ?

  • آزمون درس 9 Lecture 9 quiz

  • چگونه اولین شبکه Q خود را با استفاده از Pytorch بسازیم؟ How to Build your first Q network using pytorch ?

  • آزمون درس 10 Lecture 10 quiz

  • چگونه شبکه عصبی خود را آموزش دهیم؟ How to make your neural network learn ?

  • آزمون درس 11 Lecture 11 quiz

  • اکتشاف و بهره‌برداری با استفاده از اپسیلون حریصانه Exploration & Exploitation using epsilon greedy

  • آموزش شبکه عصبی با استفاده از Pytorch قسمت 1 Training your neural network using pytorch part1

  • آزمون درس 13 Lecture 13 quiz

  • آموزش شبکه عصبی با استفاده از Pytorch قسمت 2 Training your neural network using pytorch part2

  • آموزش دسته‌ای Batch training

  • کد پایتون آموزش روی دسته‌ها train on batches python code

  • آزمون درس 15 Lecture 15 quiz

  • معیار پاداش reward metric

  • آزمون درس 17 Lecture 17 quiz

  • شبکه هدف Target nework

  • کد پایتون آموزش عامل با شبکه هدف train your agent with target network python code

  • آزمون درس 19 Lecture 19 quiz

بازی ماشین کوهستان و یادگیری عمیق Q Mountain Car game & Deep Q-Learning

  • ماشین کوهستان در پایتون Mountain car in python

  • آزمون درس 20 Lecture 20 quiz

  • شبکه دینامیک Dynamics network

  • آزمون درس 20 Lecture 20 quiz

  • استراتژی اپسیلون حریصانه بازی ماشین کوهستان در پایتون Epsilon Greedy strategy mountain Car game in python

  • شبکه دینامیک با پایتون Dynamics Network with python

  • توزیع گاوسی چند متغیره Multi variate gaussian distribution

  • آزمون درس 21 Lecture 21 quiz

  • توزیع گاوسی چند متغیره با پایتون Multivariate gaussian distribution with python

  • استراتژی اکتشاف مبتنی بر مدل با ماشین کوهستان در پایتون Model based exploration strategy with mountain car in python

  • ماژول ICM چیست؟ What is ICM module ?

  • آزمون درس 27 Lecture 27 quiz

  • شبکه فیلتر Filter network

  • آزمون درس 28 Lecture 28 quiz

  • ساخت کد پایتون شبکه فیلتر Building Filter net python code

  • شبکه معکوس Inverse network

  • آزمون درس 30 Lecture 30 quiz

  • ساخت کد پایتون شبکه معکوس Building Inverse net python code

  • آزمون درس 31 Lecture 31 quiz

  • شبکه پیشرو Forward network

  • آزمون درس 32 Lecture 32 quiz

  • ساخت کد پایتون شبکه پیشرو Building Forward network python code

  • آزمون درس 33 Lecture 33 quiz

  • ساخت کد پایتون شبکه Q عامل و شبکه Q هدف Building Agent Q network & Target Q network python code

  • آموزش شبکه Q با ICM Training Q network with ICM

  • آموزش کد پایتون شبکه Q عامل با ICM Training Agent Q network with ICM python code

  • آزمون درس 36 Lecture 36 quiz

  • ماژول RND چیست؟ What is RND module?

  • آزمون درس 37 Lecture 37 quiz

  • ساخت کد پایتون شبکه P و شبکه T Building P net & T net python code

  • آزمون درس 38 Lecture 38 quiz

  • آموزش شبکه Q عامل با ماژول RND Training Agent Q network with RND module

بازی ف্লাپی برد و یادگیری عمیق Q Flappy bird game & Deep Q-learning

  • بازی ف্লাپی برد Flappy bird game

  • کد پایتون بازی ف্লাپی برد Flappy bird game python code

  • آزمون quiz

  • ساخت شبکه کانولوشن Q Building convolution Q network

  • آزمون quiz

  • کد پایتون شبکه Q کانولوشن با رویکرد اپسیلون حریصانه conv Q network with epsilon greedy approach python code

  • شبکه Q دو مرحله‌ای 2-steps Q network

  • کد پایتون شبکه Q دو مرحله‌ای 2-steps Q network python code

  • بافر تجربه با اولویت Prioritized Experience Replay buffer

  • آزمون quiz

  • کد پایتون بافر تجربه با اولویت Prioritized Experience Replay buffer python code

  • شبکه Q دوئلینگ Dueling Q network

  • آزمون quiz

  • کد پایتون شبکه Q دوئلینگ Dueling Q network python code

  • آزمون quiz

بازی Ms Pacman و یادگیری عمیق Q Ms Pacman game & Deep Q-Learning

  • بازی Ms Pacman Ms Pacman game

  • کد پایتون بازی Ms Pacman Ms Pacman game python code

  • کد پایتون شبکه Q پایه Basic Q network python code

  • شبکه Q N مرحله‌ای N-steps Q network

  • کد پایتون شبکه Q N مرحله‌ای N-steps Q network python code

  • شبکه Q نویزی Noisy Q network

  • کد پایتون شبکه Q نویزی Noisy Q network python code

  • کد پایتون شبکه Q دوئلینگ دوگانه نویزی Noisy double dueling Q network python code

معاملات سهام و یادگیری عمیق Q Stock trading & Deep Q-Learning

  • مبانی معاملات Basics of Trading

  • پیش پردازش داده‌های سهام Stock Data Preprocessing

  • ساخت محیط معاملات Building the trading environment

  • ساخت شبکه Q کانولوشن 1 بعدی دوئلینگ Building dueling conv1d Q network

  • آموزش ربات معاملاتی خود Train your trading robot

نمایش نظرات

آموزش یادگیری تقویتی عمیق با پایتون ۲۰۲۵
جزییات دوره
9 hours
63
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
13,679
4.3 از 5
دارد
دارد
دارد
Riad Almadani
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Riad Almadani Riad Almadani

Expert ar Kaggle نام من ریاد است. من یکی از کارشناسان سایت Kaggle و متخصص در یادگیری ماشینی، Deeplearning و زبان برنامه نویسی پایتون هستم که قبلاً در دو مسابقه Kaggle برنده شدم، اولی "MOA" و دومی petfinder. من همچنین در بحث ها و کدنویسی متخصص هستم. من همچنین با برنامه های اندروید و همچنین دستگاه های جاسازی تجربه دارم.