عوامل هوش مصنوعی (AI) را با استفاده از یادگیری تقویتی عمیق و PyTorch بسازید: DDPG، TD3، SAC، NAF، HER.
در این دوره ما گوشه ای از جهان در حال گسترش هوش مصنوعی را بررسی می کنیم و برخی از اصول اساسی موجود در یادگیری تقویتی از بازخورد انسانی (RLHF)، فناوری زیربنای ابزارهای عالی هوش مصنوعی مانند ChatGPT، Bard و غیره را مرور می کنیم.
استفاده از یادگیری عمیق در هوش مصنوعی و یادگیری تقویتی با استفاده از استراتژی های تکامل، A2C و DDPG
هوشمندترین ترکیبی از Deep Q-Learning، Policy Gradient، Actor Critic و DDPG
عوامل هوش مصنوعی (AI) را با استفاده از Deep Reinforcement Learning و PyTorch بسازید: A2C، REINFORCE، DQN و غیره.
یک دوره جامع، عملی و قابل درک در مورد یادگیری تقویتی. در مورد پروژه های Deep Q-Learning، SARSA، Deep RL، مسابقه اتومبیل رانی و پروژه های تجاری بیاموزید و با سوالات مصاحبه آماده باشید.
همه آنچه باید در مورد فرآیندهای تصمیم مارکوف، ارزش و سیاست گذاری و همچنین در مورد رویکرد یادگیری Q بدانید
چگونه عوامل می توانند در محیط های بدون پاداش یاد بگیرند
یاد بگیرید که چگونه از تکنیک های یادگیری تقویتی برای ایجاد برنامه های کاربردی هوش مصنوعی استفاده کنید!
یادگیری تقویتی را از ابتدا بیاموزید.
اصول یادگیری تقویت (RL) ، از جمله اصطلاحات ، انواع مسائلی که می توانید با RL حل کنید و روشهای مختلف برای حل این مشکلات را بیاموزید.