آموزش یادگیری تقویتی از بازخورد انسانی (RLHF)
Reinforcement Learning from Human Feedback (RLHF)
در این دوره ما گوشه ای از جهان در حال گسترش هوش مصنوعی را بررسی می کنیم و برخی از اصول اساسی موجود در یادگیری تقویتی از بازخورد انسانی (RLHF)، فناوری زیربنای ابزارهای عالی هوش مصنوعی مانند ChatGPT، Bard و غیره را مرور می کنیم.
برای دریافت و مشاهده جزییات بیشتر این دوره کلیک کنید