دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت - آخرین آپدیت

دانلود LLMOps: Evaluation, Observability, and Quality

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: ساخت سیستم‌های هوش مصنوعی مولد قابل اعتماد و در سطح صنعتی، به چیزی فراتر از مدل‌های قدرتمند نیاز دارد؛ این امر مستلزم روش‌های دقیق ارزیابی، تست، مشاهده‌پذیری و مانیتورینگ است. در دوره «LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت»، شما توانایی طراحی، پیاده‌سازی و مدیریت چارچوب‌های مستحکم ارزیابی و مشاهده‌پذیری را برای سیستم‌های مبتنی بر مدل‌های زبانی بزرگ (LLM) و سیستم‌های هوش مصنوعی چندوجهی (Multimodal) کسب خواهید کرد. ابتدا، نحوه ارزیابی خروجی‌های LLM و مدل‌های چندوجهی را با استفاده از معیارهای خودکار، ارزیابی انسانی و چارچوب‌های کیفی چندبعدی متناسب با کاربردهای واقعی تولیدی بررسی می‌کنید. سپس، با نحوه پیاده‌سازی مشاهده‌پذیری (Observability)، سیستم‌های ثبت وقایع (Logging) و خط لوله‌های ارزیابی مداوم که عملکرد، هزینه، ایمنی و کیفیت را در طول زمان ردیابی می‌کنند، آشنا می‌شوید. در نهایت، یاد می‌گیرید که چگونه تست‌های خودکار، شناسایی رانش (Drift Detection) و استراتژی‌های مانیتورینگ را برای شناسایی پس‌روی‌ها (Regressions)، مدیریت به‌روزرسانی‌های مدل و تضمین پایداری بلندمدت سیستم به کار ببرید. پس از اتمام این دوره، مهارت‌ها و دانش لازم در زمینه ارزیابی و مانیتورینگ هوش مصنوعی مولد را خواهید داشت تا بتوانید با اطمینان کامل، سیستم‌های GenAI را در محیط‌های عملیاتی مستقر کرده، مدیریت نمایید و مقیاس آن‌ها را افزایش دهید.

سرفصل ها و درس ها

معیارها و چارچوب‌های ارزیابی LLM LLM Evaluation Metrics and Frameworks

دسته‌بندی معیارهای ارزیابی LLM LLM Evaluation Metric Categories
طراحی مجموعه‌داده‌های ارزیابی Designing Evaluation Datasets
ارزیابی چندبعدی Multidimensional Evaluation
استراتژی‌های ارزیابی چندوجهی Multimodal Evaluation Strategies
دمو: مجموعه‌داده‌های ارزیابی چندوجهی Demo: Multimodal Evaluation Datasets

مشاهده‌پذیری، ثبت وقایع و ارزیابی Observability, Logging, and Evaluation

ثبت درخواست‌های GenAI Logging GenAI Requests
طرح‌های لاگینگ و انطباق Logging Schemas and Compliance
تست رگرسیون برای GenAI Regression Testing for GenAI
خط لوله‌های ارزیابی مداوم Continuous Evaluation Pipelines
داشبوردهای ارزیابی Evaluation Dashboards
دمو: مشاهده‌پذیری Demo: Observability

استراتژی‌های تست خودکار Automated Testing Strategies

هرم تست GenAI GenAI Testing Pyramid
تست واحد (Unit Testing) اجزای LLM Unit Testing of LLM Components
گردش‌های کاری تست یکپارچه‌سازی Integration Testing Workflows
تست مبتنی بر ویژگی (Property-based Testing) Property-based Testing
دمو: تست‌های GenAI Demo: GenAI Tests

شناسایی رانش و مانیتورینگ مدل Drift Detection and Model Monitoring

انواع رانش (Drift) در سیستم‌های GenAI Types of Drift in GenAI Systems
سیستم‌های شناسایی رانش Drift Detection Systems
داشبوردهای مانیتورینگ Monitoring Dashboards
تست کاناری و استقرار تدریجی Canary Testing and Rollouts
ردیابی آزمایش‌ها و بازگشت (Rollback) Experiment Tracking and Rollback
دمو: ردیابی آزمایش‌ها Demo: Experiment Tracking

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت

جزییات دوره

زمان دوره: 1h 58m

تعداد ویدیو ها: 22

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 3

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Yasir Khan

لینک کوتاه این دوره

https://donyad.com/d/1857a7

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Generative AI هوش مصنوعی مولد

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش LLMOps: ارزیابی، مشاهده‌پذیری و کیفیت - آخرین آپدیت

دانلود LLMOps: Evaluation, Observability, and Quality

معیارها و چارچوب‌های ارزیابی LLM LLM Evaluation Metrics and Frameworks

دسته‌بندی معیارهای ارزیابی LLM LLM Evaluation Metric Categories

طراحی مجموعه‌داده‌های ارزیابی Designing Evaluation Datasets

ارزیابی چندبعدی Multidimensional Evaluation

استراتژی‌های ارزیابی چندوجهی Multimodal Evaluation Strategies

دمو: مجموعه‌داده‌های ارزیابی چندوجهی Demo: Multimodal Evaluation Datasets

مشاهده‌پذیری، ثبت وقایع و ارزیابی Observability, Logging, and Evaluation

ثبت درخواست‌های GenAI Logging GenAI Requests

طرح‌های لاگینگ و انطباق Logging Schemas and Compliance

تست رگرسیون برای GenAI Regression Testing for GenAI

خط لوله‌های ارزیابی مداوم Continuous Evaluation Pipelines

داشبوردهای ارزیابی Evaluation Dashboards

دمو: مشاهده‌پذیری Demo: Observability

استراتژی‌های تست خودکار Automated Testing Strategies

هرم تست GenAI GenAI Testing Pyramid

تست واحد (Unit Testing) اجزای LLM Unit Testing of LLM Components

گردش‌های کاری تست یکپارچه‌سازی Integration Testing Workflows

تست مبتنی بر ویژگی (Property-based Testing) Property-based Testing

دمو: تست‌های GenAI Demo: GenAI Tests

شناسایی رانش و مانیتورینگ مدل Drift Detection and Model Monitoring

انواع رانش (Drift) در سیستم‌های GenAI Types of Drift in GenAI Systems

سیستم‌های شناسایی رانش Drift Detection Systems

داشبوردهای مانیتورینگ Monitoring Dashboards

تست کاناری و استقرار تدریجی Canary Testing and Rollouts

ردیابی آزمایش‌ها و بازگشت (Rollback) Experiment Tracking and Rollback

دمو: ردیابی آزمایش‌ها Demo: Experiment Tracking

نمایش نظرات

https://donyad.com/d/1857a7

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar