آموزش ارزیابی متن و امنیت مدل‌های زبانی - آخرین آپدیت

دانلود Context Evaluation and Safety

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: کار با مدل‌های زبانی بزرگ (LLMs) همیشه بهترین نتایج را به همراه ندارد. در این دوره آموزشی با عنوان «ارزیابی متن و امنیت»، شما یاد می‌گیرید که چگونه تست‌های مبتنی بر متریک بسازید و تفاوت بین توهم (Hallucination) و وفاداری به متن (Faithfulness) را تحلیل کنید. ابتدا با استفاده از پایتون و کتابخانه‌های ارزیابی مانند DeepSeek، نحوه تست مدل از طریق مقایسه خروجی‌ها با داده‌های مرجع (Ground Truths) را بررسی خواهید کرد. سپس، روش‌های ایجاد یک سیستم امتیازدهی برای ارزیابی نسبت ادعاهای پشتیبانی شده به عنوان آزمونی برای سنجش عدالت و دقت را خواهید آموخت. در نهایت، نحوه ساخت فرآیندهای خودکار برای تست دوره‌ای مدل را یاد می‌گیرید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم در زمینه ارزیابی کانتکست و اعتبارسنجی‌های امنیتی را کسب خواهید کرد تا بتوانید سیستم داوری خودتان را با مدل LLM-as-a-judge پیاده‌سازی کنید.

سرفصل ها و درس ها

تست خروجی مدل Model Output Testing

  • تست خروجی مدل Model Output Testing

  • دمو: ساخت یک تست تاییدیه Demo: Build a Verification Test

  • بررسی طراحی راهکار Solution Design Review

  • ساخت داور LLM Building the LLM Judge

  • دمو: امتیازدهی به نتایج Demo: Scoring the Results

اتوماسیون ارزیابی Evaluation Automation

  • کانتکست منبع طلایی منتخب Curated Gold Source Context

  • بررسی تصادفی توصیه‌های منتخب Spot-check the Curated Recommendation

  • زمان‌بندی فرآیند ارزیابی Scheduling the Evaluation Process

  • خودکارسازی فرآیند ارزیابی Automating the Evaluation Process

امنیت و حاکمیت متن Context Safety and Governance

  • امنیت و حاکمیت متن Context Safety and Governance

  • تعبیه امنیت در فرآیند Embedding Security in the Process

  • جمع‌بندی نهایی Putting It All Together

نمایش نظرات

آموزش ارزیابی متن و امنیت مدل‌های زبانی
جزییات دوره
41m
12
(آخرین آپدیت)
4
از 5
دارد
دارد
دارد
Darryl Brown
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Darryl Brown Darryl Brown

من با بیش از ۲۰ سال تجربه در طراحی و توسعه نرم‌افزار، متخصص و رهبر مهندسی ابری در شرکت خود هستم و راهکارهای پیچیده و نوآورانه را برای یک ارائه‌دهنده جهانی بیمه مدیریت می‌کنم. به عنوان معاون رئیس و مهندس ارشد ابری، بر معماری، طراحی، زیرساخت به عنوان کد (IaC)، DevSecOps، رهبری و نوآوری در اپلیکیشن‌ها و خدمات مبتنی بر ابر با استفاده از پلتفرم Microsoft Azure نظارت دارم. من عاشق به اشتراک گذاشتن دانش خود هستم و یک یادگیرنده مادام‌العمر می‌باشم.