آموزش یادگیری تقویتی پیشرفته: روش‌های گرادیان سیاست

دانلود Advanced Reinforcement Learning: policy gradient methods

ساخت عوامل هوش مصنوعی (AI) با استفاده از یادگیری تقویتی عمیق و PyTorch: (REINFORCE، A2C، PPO و غیره) Udemy (یودمی)