🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش هوش مصنوعی چهارم - یادگیری تقویتی در جاوا
- آخرین آپدیت
Artificial Intelligence IV - Reinforcement Learning in Java
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
همه آنچه باید در مورد فرآیندهای تصمیم گیری مارکوف، ارزش و سیاست گذاری و همچنین در مورد رویکرد یادگیری Q بدانید درک یادگیری تقویتی درک فرآیندهای تصمیم گیری مارکوف درک ارزش و تکرار سیاست درک رویکرد یادگیری Q و کاربردهای آن پیش نیازها:Basics AI دانش: شبکه های عصبی در اصل
این دوره در مورد یادگیری تقویتی است. اولین قدم این است که درباره پیشینه ریاضی صحبت کنیم: میتوانیم از فرآیند تصمیمگیری مارکوف به عنوان مدلی برای یادگیری تقویتی استفاده کنیم. ما می توانیم مشکل را از 3 راه حل کنیم: تکرار ارزش، تکرار سیاست و یادگیری Q. یادگیری Q یک رویکرد بدون مدل است، بنابراین رویکردی پیشرفته است. سیاست بهینه را با تعامل با محیط می آموزد. بنابراین این موضوعات هستند:
فرایندهای تصمیم مارکوف
تکرار ارزش و تکرار خط مشی
اصول یادگیری Q
الگوریتم های مسیریابی با یادگیری Q
یادگیری Q با شبکه های عصبی
سرفصل ها و درس ها
معرفی
Introduction
معرفی
Introduction
انواع یادگیری
Types of learning
کاربردهای یادگیری تقویتی
Applications of reinforcement learning
نظریه فرآیند تصمیم گیری مارکوف (MDP).
Markov Decision Process (MDP) Theory
مبانی فرآیندهای تصمیم مارکوف I
Markov decision processes basics I
مبانی فرآیندهای تصمیم مارکوف II
Markov decision processes basics II
نمایش نظرات