آموزش یادگیری تقویتی برای مسائل تحقیق در عملیات - آخرین آپدیت

دانلود Reinforcement Learning for Operations Research Problems

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

یادگیری تقویتی: حل چالش‌های بزرگ با هوش مصنوعی

قدرت یادگیری تقویتی را برای حل چالش‌های دشوار بشریت مهار کنید!

مبانی یادگیری تقویتی

اصول اصلی و اهمیت یادگیری تقویتی را در حل چالش‌های پیچیده هوش مصنوعی درک کنید.

برنامه‌ریزی پویا برای تخصیص منابع

یک چارچوب تکرار سیاست برای بهینه‌سازی تخصیص منابع و به حداکثر رساندن عملکرد کلی ایجاد کنید.

بهینه‌سازی مدیریت موجودی و مسیریابی

عوامل Q-Learning را برای مقابله با بهینه‌سازی موجودی و مسیریابی پیاده‌سازی کنید و بهترین استراتژی‌ها را پیدا کنید.

محیط‌های سفارشی برای یادگیری تقویتی عمیق

محیط‌های سفارشی را برای آموزش مدل‌های Deep RL برای حل مسائل مسیریابی دنیای واقعی طراحی و بسازید.

شبکه‌های Q عمیق (DQN) در عمل

DQN را برای حل یک مسئله مسیریابی دنیای واقعی به کار ببرید و قدرت Deep RL را در عمل تجربه کنید.

آیا آماده هستید تا پتانسیل کامل هوش مصنوعی را باز کنید؟ به دوره هیجان انگیز ما در Udemy بپیوندید، جایی که ما به دنیای یادگیری تقویتی، نیروی محرکه پشت پیشرفت های بی شماری از هوش مصنوعی که زندگی ما را ساده می کند، شیرجه می زنیم. اکنون، زمان آن رسیده است که این فناوری قدرتمند را مهار کرده و آن را برای برخی از چالش برانگیزترین مشکلاتی که بشریت با آن روبرو است به کار گیریم.

در هر دو زمینه صنعتی و شخصی، مسائل برنامه ریزی و زمان بندی به دلیل ماهیت پیچیده خود موانع بزرگی را ایجاد می کنند. اما نترسید! یادگیری تقویتی راه حلی برای شکستن این موانع و بهینه سازی عملیات، کاهش هزینه ها و تبدیل جهان به مکانی بهتر برای زندگی ارائه می دهد.

اگر مجذوب شگفتی های تحقیق در عملیات هستید، از تخصیص منابع و برنامه ریزی تولید گرفته تا بهینه سازی موجودی و یافتن مسیر، این دوره برای شما طراحی شده است. یاد بگیرید که از قابلیت های چشمگیر الگوریتم های یادگیری تقویتی استفاده کنید و با اطمینان این چالش های دنیای واقعی را حل کنید.

دوره جامع ما شما را به سفری روشنگرانه در تئوری یادگیری تقویتی می برد و ارتباط آن با مسائل تحقیق در عملیات را آشکار می کند. با درک روشنی از تئوری، به تمرین‌های کدنویسی عملی می‌پردازیم و همه چیز را از ابتدا با استفاده از پایتون و کتابخانه‌های ضروری می‌سازیم.

چرا به یادگیری منفعل بسنده کنید در حالی که می توانید از طریق تمرین به تسلط برسید؟ شما تمام کدها را از ابتدا پیاده سازی خواهید کرد و از درک عمیق مطالب و افزایش مهارت های حل مسئله خود اطمینان حاصل می کنید.

با شروع برنامه نویسی پویا، به تخصیص منابع می پردازیم و سپس با استفاده از Q-learning به بهینه سازی موجودی و مسیریابی می پردازیم. با پیشرفت، چالش نهایی را بر عهده می گیریم: به کارگیری یادگیری تقویتی عمیق در یک پروژه دنیای واقعی از ابتدا. با طراحی محیط از ابتدا و استفاده از چارچوب پیشرفته PyTorch برای یادگیری عمیق، این اطمینان را به دست خواهید آورد که هر مسئله تحقیق در عملیات را با استفاده از یادگیری تقویتی حل کنید.

در پایان این دوره، به لطف درک قوی از ساختار منحصر به فرد و کاربردهای عملی آن، برای استفاده از یادگیری تقویتی در هر مسئله تحقیق در عملیات مجهز خواهید شد. در این سفر هیجان انگیز به ما بپیوندید و با هم یاد بگیریم و نحوه برخورد خود با حل مسائل پیچیده را متحول کنیم!

آیا آماده هستید تا این ماجراجویی هیجان انگیز را آغاز کنید؟ اکنون ثبت نام کنید و اولین قدم را برای تبدیل شدن به یک متخصص یادگیری تقویتی بردارید!

پیش نیازها

توصیه می شود برای درک بهتر و مهارت در بخش کدنویسی، درک اولیه از برنامه نویسی پایتون داشته باشید.


سرفصل ها و درس ها

مرور کلی Overview

  • چرا این دوره؟ Why This Course

  • این دوره برای چه کسانی است؟ Who is this course for?

  • اهداف دوره و منابع Course objectives and Resources

مقدمه ای بر بهینه سازی ریاضی Introduction to Mathematical Optimization

  • مثال زنجیره تامین Supply Chain Example

  • بهینه سازی ریاضی چیست؟ What is Mathematical Optimization?

  • رویکردهای مختلف ریاضی و محدودیت های آنها Different mathematical approaches and their limitations

مقدمه ای بر تحقیق در عملیات Introduction to Operations Research

  • OR چیست؟ What is OR?

  • مثال فرمول بندی MILP MILP formulation example

  • ابزارهایی برای حل مدل های OR Tools for solving OR models

مقدمه ای بر یادگیری تقویتی Introduction to Reinforcement Learning

  • منطق پشت بسیاری از الگوریتم ها Logic behind many algorithms

  • تصمیم گیری متوالی پیچیده در شرایط عدم اطمینان Complex sequential decision making under uncertainty

  • برنامه نویسی پویا Dynamic programming

  • مثال برنامه نویسی پویا Dynamic programming example

  • فرایند تصمیم گیری مارکوف Markov Decision Process

  • معادله بلمن Bellman equation

  • اجزای MDP MDP components

  • اجزای یادگیری تقویتی Reinforcement Learning components

  • یادگیری مونت کارلو، یادگیری تفاوت زمانی Monte Carlo Learning, Temporal Difference Learning

  • Q-Learning Q-Learning

  • Off Policy، On Policy Learning Off Policy, On Policy Learning

  • مبانی یادگیری تقویتی عمیق Deep Reinforcement Learning Foundations

تخصیص منابع با برنامه نویسی پویا Resource Allocation with Dynamic Programming

  • معرفی Google Colab Introduction to Google Colab

  • شرح مسئله تخصیص منابع Resource Allocation problem description

  • تعریف پارامترهای مسئله Define problem parameters

  • تعریف پارامترهای الگوریتم Define algorithm parameters

  • ماتریس انتقال-بخش 1 Transition matrix-Part 1

  • ماتریس انتقال-بخش 2 Transition matrix-Part 2

  • توضیح General Policy Iteration (GPI) General Policy Iteration (GPI) explained

  • ارزیابی سیاست Policy Evaluation

  • بهبود سیاست Policy Improvement

  • تفسیر نتایج Interpret results

بهینه سازی موجودی با Q-Learning Inventory Optimization with Q-Learning

  • شرح مسئله بهینه سازی مدیریت موجودی Inventory management optimization problem description

  • تعریف پارامترها Define parameters

  • Action Policy Action Policy

  • Reward signal Reward signal

  • معادله بلمن Bellman equation

  • سیاست بهینه Optimal policy

مسئله فروشنده دوره گرد با Q-Learning Travel Salesman problem with Q-Learning

  • شرح مسئله TSP TSP problem description

  • تعریف پارامترها Define parameters

  • استراتژی انتخاب Action Action selection strategy

  • به روز رسانی Q-table Update Q-table

  • الگوریتم Q-Learning Q-Learning algorithm

  • استخراج بهترین مسیر Extract best route

مسئله فروشنده دوره گرد با Deep Q-Networks Travel Salesman problem with Deep Q-Networks

  • نحوه طراحی محیط سفارشی بر اساس کتابخانه OpenAI gym How to design customized environment based on OpenAI gym library

  • تعریف پارامترها Define parameters

  • تابع reset() reset() function

  • تابع step() step() function

  • تست محیط Test the environment

  • شبکه DQN DQN network

  • ایده Reply buffer Reply buffer idea

  • کلاس Reply buffer Reply buffer class

  • مقداردهی اولیه عامل DQN Initialization of DQN agent

  • استراتژی انتخاب Action Action selection strategy

  • چرا شبکه policy و target؟ Why policy and target network?

  • دریافت مقادیر Q Get Q-values

  • به روز رسانی شبکه policy Update policy network

  • به روز رسانی شبکه target Update target network

  • نمایش بصری مقادیر loss Visualize loss values

  • دریافت بهترین مسیر Get the best route

  • حلقه اصلی آموزش Main training loop

نمایش نظرات

آموزش یادگیری تقویتی برای مسائل تحقیق در عملیات
جزییات دوره
7 hours
60
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
191
4.3 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Hadi Aghazadeh Hadi Aghazadeh

دانشمند داده