لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش هوش مصنوعی چهارم - یادگیری تقویتی در جاوا
Artificial Intelligence IV - Reinforcement Learning in Java
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
همه آنچه باید در مورد فرآیندهای تصمیم گیری مارکوف، ارزش و سیاست گذاری و همچنین در مورد رویکرد یادگیری Q بدانید درک یادگیری تقویتی درک فرآیندهای تصمیم گیری مارکوف درک ارزش و تکرار سیاست درک رویکرد یادگیری Q و کاربردهای آن پیش نیازها:Basics AI دانش: شبکه های عصبی در اصل
این دوره در مورد یادگیری تقویتی است. اولین قدم این است که درباره پیشینه ریاضی صحبت کنیم: میتوانیم از فرآیند تصمیمگیری مارکوف به عنوان مدلی برای یادگیری تقویتی استفاده کنیم. ما می توانیم مشکل را از 3 راه حل کنیم: تکرار ارزش، تکرار سیاست و یادگیری Q. یادگیری Q یک رویکرد بدون مدل است، بنابراین رویکردی پیشرفته است. سیاست بهینه را با تعامل با محیط می آموزد. بنابراین این موضوعات هستند:
فرایندهای تصمیم مارکوف
تکرار ارزش و تکرار خط مشی
اصول یادگیری Q
الگوریتم های مسیریابی با یادگیری Q
یادگیری Q با شبکه های عصبی
سرفصل ها و درس ها
معرفی
Introduction
معرفی
Introduction
انواع یادگیری
Types of learning
کاربردهای یادگیری تقویتی
Applications of reinforcement learning
نظریه فرآیند تصمیم گیری مارکوف (MDP).
Markov Decision Process (MDP) Theory
مبانی فرآیندهای تصمیم مارکوف I
Markov decision processes basics I
مبانی فرآیندهای تصمیم مارکوف II
Markov decision processes basics II
نمایش نظرات