آموزش هوش مصنوعی چهارم - یادگیری تقویتی در جاوا

Artificial Intelligence IV - Reinforcement Learning in Java

در حال بارگزاری نمونه ویدیو، لطفا صبر کنید...
Video Player is loading.
Current Time 0:00
Duration 0:00
Loaded: 0%
Stream Type LIVE
Remaining Time 0:00
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles off, selected
      نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
      نمونه ویدیوها:
      • در حال بارگزاری، لطفا صبر کنید...
      توضیحات دوره: همه آنچه باید در مورد فرآیندهای تصمیم گیری مارکوف، ارزش و سیاست گذاری و همچنین در مورد رویکرد یادگیری Q بدانید درک یادگیری تقویتی درک فرآیندهای تصمیم گیری مارکوف درک ارزش و تکرار سیاست درک رویکرد یادگیری Q و کاربردهای آن پیش نیازها:Basics AI دانش: شبکه های عصبی در اصل

      این دوره در مورد یادگیری تقویتی است. اولین قدم این است که درباره پیشینه ریاضی صحبت کنیم: می‌توانیم از فرآیند تصمیم‌گیری مارکوف به عنوان مدلی برای یادگیری تقویتی استفاده کنیم. ما می توانیم مشکل را از 3 راه حل کنیم: تکرار ارزش، تکرار سیاست و یادگیری Q. یادگیری Q یک رویکرد بدون مدل است، بنابراین رویکردی پیشرفته است. سیاست بهینه را با تعامل با محیط می آموزد. بنابراین این موضوعات هستند:

      •  فرایندهای تصمیم مارکوف
      •  تکرار ارزش و تکرار خط مشی
      • اصول یادگیری Q
      • الگوریتم های مسیریابی با یادگیری Q
      • یادگیری Q با شبکه های عصبی

      سرفصل ها و درس ها

      معرفی Introduction

      • معرفی Introduction

      • انواع یادگیری Types of learning

      • کاربردهای یادگیری تقویتی Applications of reinforcement learning

      نظریه فرآیند تصمیم گیری مارکوف (MDP). Markov Decision Process (MDP) Theory

      • مبانی فرآیندهای تصمیم مارکوف I Markov decision processes basics I

      • مبانی فرآیندهای تصمیم مارکوف II Markov decision processes basics II

      • فرآیندهای تصمیم مارکوف - معادلات Markov decision processes - equations

      • فرآیندهای تصمیم مارکوف - تصویر Markov decision processes - illustration

      • معادله بلمن Bellman-equation

      • چگونه مشکلات MDP را حل کنیم؟ How to solve MDP problems?

      • فرمول ریاضی یادگیری تقویتی Mathematical formulation of reinforcement learning

      • آزمون مبانی یادگیری تقویتی Reinforcement Learning Basics Quiz

      فرآیند تصمیم گیری مارکوف - تکرار ارزش Markov Decision Process - Value Iteration

      • تکرار ارزش چیست؟ What is value iteration?

      • اجرای تکرار ارزش I Value iteration implementation I

      • اجرای تکرار ارزش II Value iteration implementation II

      • اجرای تکرار ارزش III Value iteration implementation III

      • اجرای تکرار ارزش IV Value iteration implementation IV

      • اجرای تکرار ارزش V Value iteration implementation V

      فرآیند تصمیم گیری مارکوف - تکرار سیاست Markov Decision Process - Policy Iteration

      • تکرار سیاست چیست؟ What is policy iteration?

      • تکرار ارزش در مقابل تکرار سیاست Value iteration vs policy iteration

      نظریه یادگیری Q Q Learning Theory

      • مقدمه یادگیری Q Q learning introduction

      • مقدمه یادگیری Q - الگوریتم Q learning introduction - the algorithm

      • تصویر یادگیری Q Q learning illustration

      • فرمول بندی ریاضی یادگیری کیو Mathematical formulation of Q learning

      • آزمون یادگیری Q Q Learning Quiz

      مسیریابی با Q-Learning Pathfinding with Q-Learning

      • ---- راه یابی ---- ---- PATHFINDING ----

      • مسیریابی با یادگیری Q I Pathfinding with Q-learning I

      • مسیریابی با یادگیری Q II Pathfinding with Q-learning II

      • مسیریابی با یادگیری Q III Pathfinding with Q-learning III

      • مسیریابی با یادگیری Q-IV Pathfinding with Q-learning IV

      • ---- کوتاه ترین راه ---- ---- SHORTEST PATH ----

      • کوتاه ترین مسیر با یادگیری کیو Shortest path with Q-learning

      مشکل اکتشاف در مقابل بهره برداری Exploration vs. Exploitation Problem

      • مشکل اکتشاف در مقابل استثمار Exploration vs exploitation problem

      • معرفی مشکل راهزن مسلح N N-armed bandit problem introduction

      • پیاده سازی مشکل راهزن مسلح N-I N-armed bandit problem implementation I

      • پیاده سازی مشکل راهزن مسلح N II N-armed bandit problem implementation II

      • کاربردها: تست A/B در بازاریابی Applications: A/B testing in marketing

      • مسابقه اکتشاف در مقابل بهره برداری Exploration vs. Exploitation Quiz

      نظریه یادگیری تقویتی عمیق Deep Reinforcement Learning Theory

      • یادگیری عمیق Q چیست؟ What is deep Q learning?

      • یادگیری دیپ کیو و استراتژی ε-غریب Deep Q learning and ε-greedy strategy

      • مقدمه یادگیری عمیق Q - به خاطر بسپارید و دوباره پخش کنید Deep Q-learning introduction - remember and replay

      • فرمول ریاضی یادگیری عمیق کیو Mathematical formulation of deep Q learning

      • مسابقه یادگیری عمیق Q Deep Q Learning Quiz

      مواد درسی (دانلود) Course Materials (DOWNLOADS)

      • مواد درسی Course materials

      نمایش نظرات

      آموزش هوش مصنوعی چهارم - یادگیری تقویتی در جاوا
      جزییات دوره
      3 hours
      39
      Udemy (یودمی) Udemy (یودمی)
      (آخرین آپدیت)
      1,775
      4.9 از 5
      دارد
      دارد
      دارد
      جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

      Google Chrome Browser

      Internet Download Manager

      Pot Player

      Winrar

      Holczer Balazs Holczer Balazs

      مهندس نرم افزار