آموزش یادگیری تقویتی پیشرفته: روشهای گرادیان سیاست
دانلود Advanced Reinforcement Learning: policy gradient methods
ساخت عوامل هوش مصنوعی (AI) با استفاده از یادگیری تقویتی عمیق و PyTorch: (REINFORCE، A2C، PPO و غیره)
برای دریافت و مشاهده جزییات بیشتر این دوره کلیک کنید