آموزش LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت - آخرین آپدیت

دانلود LLMOps: Evaluation, Observability, and Quality

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: ساخت سیستم‌های هوش مصنوعی مولد قابل اعتماد و در سطح صنعتی، به چیزی فراتر از مدل‌های قدرتمند نیاز دارد؛ این امر مستلزم روش‌های دقیق ارزیابی، تست، مشاهده‌پذیری و مانیتورینگ است. در دوره «LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت»، شما توانایی طراحی، پیاده‌سازی و مدیریت چارچوب‌های مستحکم ارزیابی و مشاهده‌پذیری را برای سیستم‌های مبتنی بر مدل‌های زبانی بزرگ (LLM) و سیستم‌های هوش مصنوعی چندوجهی (Multimodal) کسب خواهید کرد. ابتدا، نحوه ارزیابی خروجی‌های LLM و مدل‌های چندوجهی را با استفاده از معیارهای خودکار، ارزیابی انسانی و چارچوب‌های کیفی چندبعدی متناسب با کاربردهای واقعی تولیدی بررسی می‌کنید. سپس، با نحوه پیاده‌سازی مشاهده‌پذیری (Observability)، سیستم‌های ثبت وقایع (Logging) و خط لوله‌های ارزیابی مداوم که عملکرد، هزینه، ایمنی و کیفیت را در طول زمان ردیابی می‌کنند، آشنا می‌شوید. در نهایت، یاد می‌گیرید که چگونه تست‌های خودکار، شناسایی رانش (Drift Detection) و استراتژی‌های مانیتورینگ را برای شناسایی پس‌روی‌ها (Regressions)، مدیریت به‌روزرسانی‌های مدل و تضمین پایداری بلندمدت سیستم به کار ببرید. پس از اتمام این دوره، مهارت‌ها و دانش لازم در زمینه ارزیابی و مانیتورینگ هوش مصنوعی مولد را خواهید داشت تا بتوانید با اطمینان کامل، سیستم‌های GenAI را در محیط‌های عملیاتی مستقر کرده، مدیریت نمایید و مقیاس آن‌ها را افزایش دهید.

سرفصل ها و درس ها

معیارها و چارچوب‌های ارزیابی LLM LLM Evaluation Metrics and Frameworks

  • دسته‌بندی معیارهای ارزیابی LLM LLM Evaluation Metric Categories

  • طراحی مجموعه‌داده‌های ارزیابی Designing Evaluation Datasets

  • ارزیابی چندبعدی Multidimensional Evaluation

  • استراتژی‌های ارزیابی چندوجهی Multimodal Evaluation Strategies

  • دمو: مجموعه‌داده‌های ارزیابی چندوجهی Demo: Multimodal Evaluation Datasets

مشاهده‌پذیری، ثبت وقایع و ارزیابی Observability, Logging, and Evaluation

  • ثبت درخواست‌های GenAI Logging GenAI Requests

  • طرح‌های لاگینگ و انطباق Logging Schemas and Compliance

  • تست رگرسیون برای GenAI Regression Testing for GenAI

  • خط لوله‌های ارزیابی مداوم Continuous Evaluation Pipelines

  • داشبوردهای ارزیابی Evaluation Dashboards

  • دمو: مشاهده‌پذیری Demo: Observability

استراتژی‌های تست خودکار Automated Testing Strategies

  • هرم تست GenAI GenAI Testing Pyramid

  • تست واحد (Unit Testing) اجزای LLM Unit Testing of LLM Components

  • گردش‌های کاری تست یکپارچه‌سازی Integration Testing Workflows

  • تست مبتنی بر ویژگی (Property-based Testing) Property-based Testing

  • دمو: تست‌های GenAI Demo: GenAI Tests

شناسایی رانش و مانیتورینگ مدل Drift Detection and Model Monitoring

  • انواع رانش (Drift) در سیستم‌های GenAI Types of Drift in GenAI Systems

  • سیستم‌های شناسایی رانش Drift Detection Systems

  • داشبوردهای مانیتورینگ Monitoring Dashboards

  • تست کاناری و استقرار تدریجی Canary Testing and Rollouts

  • ردیابی آزمایش‌ها و بازگشت (Rollback) Experiment Tracking and Rollback

  • دمو: ردیابی آزمایش‌ها Demo: Experiment Tracking

نمایش نظرات

آموزش LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت
جزییات دوره
1h 58m
22
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
Yasir Khan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Yasir Khan Yasir Khan

معامله گر فعال فارکس