آموزش ارزیابی زمینه و امنیت مدل‌های زبانی - آخرین آپدیت

دانلود Context Evaluation and Safety

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: کار با مدل‌های زبانی بزرگ (LLM) همیشه بهترین نتایج را به همراه ندارد. در این دوره آموزشی با عنوان «ارزیابی زمینه و امنیت»، شما یاد می‌گیرید که چگونه تست‌های مبتنی بر معیار بسازید و تفاوت بین توهم (Hallucination) و وفاداری به متن (Faithfulness) را تحلیل کنید. ابتدا با استفاده از پایتون و کتابخانه‌های ارزیابی مانند DeepSeek، روش‌های تست مدل از طریق مقایسه خروجی‌ها با داده‌های مرجع (Ground Truths) را بررسی می‌کنید. سپس، نحوه ایجاد یک سیستم امتیازدهی برای ارزیابی نسبت ادعاهای پشتیبانی شده به عنوان آزمونی برای سنجش عدالت (Fairness) را خواهید آموخت. در نهایت، با نحوه ساخت فرآیندهای خودکار برای تست دوره‌ای مدل آشنا می‌شوید. در پایان این دوره، شما مهارت‌ها و دانش لازم برای ارزیابی زمینه و اعتبارسنجی‌های امنیتی را کسب خواهید کرد تا بتوانید سیستم «LLM-as-a-judge» (مدل زبانی به عنوان داور) اختصاصی خود را پیاده‌سازی کنید.

سرفصل ها و درس ها

تست خروجی مدل Model Output Testing

  • تست خروجی مدل Model Output Testing

  • دمو: ساخت یک تست تاییدیه Demo: Build a Verification Test

  • بررسی طراحی راهکار Solution Design Review

  • ساخت داور LLM Building the LLM Judge

  • دمو: امتیازدهی به نتایج Demo: Scoring the Results

اتوماسیون ارزیابی Evaluation Automation

  • زمینه منبع طلایی منتخب Curated Gold Source Context

  • بررسی تصادفی توصیه‌های منتخب Spot-check the Curated Recommendation

  • زمان‌بندی فرآیند ارزیابی Scheduling the Evaluation Process

  • خودکارسازی فرآیند ارزیابی Automating the Evaluation Process

امنیت زمینه و حاکمیت داده Context Safety and Governance

  • امنیت زمینه و حاکمیت داده Context Safety and Governance

  • تعبیه امنیت در فرآیند Embedding Security in the Process

  • جمع‌بندی و اجرای نهایی Putting It All Together

نمایش نظرات

آموزش ارزیابی زمینه و امنیت مدل‌های زبانی
جزییات دوره
41m
12
(آخرین آپدیت)
4
از 5
دارد
دارد
دارد
Darryl Brown
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Darryl Brown Darryl Brown

من با بیش از ۲۰ سال تجربه در طراحی و توسعه نرم‌افزار، متخصص و رهبر مهندسی ابری در شرکت خود هستم و راهکارهای پیچیده و نوآورانه را برای یک ارائه‌دهنده جهانی بیمه مدیریت می‌کنم. به عنوان معاون رئیس و مهندس ارشد ابری، بر معماری، طراحی، زیرساخت به عنوان کد (IaC)، DevSecOps، رهبری و نوآوری در اپلیکیشن‌ها و خدمات مبتنی بر ابر با استفاده از پلتفرم Microsoft Azure نظارت دارم. من عاشق به اشتراک گذاشتن دانش خود هستم و یک یادگیرنده مادام‌العمر می‌باشم.