آموزش یادگیری تقویتی از بازخورد انسانی (RLHF)

Reinforcement Learning from Human Feedback (RLHF)

در این دوره ما گوشه ای از جهان در حال گسترش هوش مصنوعی را بررسی می کنیم و برخی از اصول اساسی موجود در یادگیری تقویتی از بازخورد انسانی (RLHF)، فناوری زیربنای ابزارهای عالی هوش مصنوعی مانند ChatGPT، Bard و غیره را مرور می کنیم.

برای دریافت و مشاهده جزییات بیشتر این دوره کلیک کنید