آموزش ارزیابی مدل و بنچ‌مارکینگ - آخرین آپدیت

دانلود Model Evaluation and Benchmarking

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: دوره ارزیابی مدل و بنچ‌مارکینگ برای توسعه‌دهندگان، مهندسان و سازندگان محصولات فنی طراحی شده است که در حوزه هوش مصنوعی مولد (Generative AI) تازه‌کار هستند اما دارای دانش متوسط در یادگیری ماشین، تسلط پایه به پایتون و آشنایی با محیط‌های توسعه مانند VS Code می‌باشند و قصد دارند راهکارهای متن‌باز هوش مصنوعی مولد را مهندسی، سفارشی‌سازی و مستقر کنند تا از وابستگی به یک فروشنده خاص (Vendor Lock-in) جلوگیری نمایند. این دوره زبان‌آموزان را به مهارت‌های لازم برای سنجش و مقایسه عملکرد مدل‌های مولد متن و تصویر مجهز می‌کند. با شروع از ارزیابی متن، دانشجویان معیارهای استانداردی مانند Perplexity، BLEU، ROUGE و BERTScore را به کار می‌گیرند و همزمان پروتکل‌های ارزیابی انسانی و روش‌های خاص برای کاربردهایی مانند خلاصه‌سازی یا ترجمه را طراحی می‌کنند. سپس دوره به بررسی ارزیابی تصاویر با استفاده از معیارهای فنی از جمله FID، شباهت CLIP و SSIM، در کنار تکنیک‌های ارزیابی مبتنی بر ادراک انسانی و سیستم‌های تشخیص مصنوعات (Artifact Detection) می‌پردازد. در ماژول نهایی، زبان‌آموزان چارچوب‌های جامع بنچ‌مارکینگ را با محیط‌های تست تکرارپذیر، کنترل نسخه و داشبوردهای بصری برای نظارت مستمر طراحی می‌کنند. در پایان، کاربران قادر خواهند بود سیستم‌های ارزیابی خودکار و تخصصی را پیاده‌سازی کرده و گزارش‌های دقیق عملکردی ارائه دهند که تضمین می‌کند مدل‌های مولد با استانداردهای کیفی سخت‌گیرانه مطابقت دارند.

سرفصل ها و درس ها

معیارها و ابزارهای تولید متن Text Generation Metrics and Tools

  • پادکست: مشکلاتی که معیارهای متنی برای حل آن‌ها ساخته شدند Podcast: The Problems Text Metrics Were Built to Solve

  • اولین خط لوله ارزیابی شما با Hugging Face Your First Evaluation Pipeline with Hugging Face

  • ارزیابی پیشرفته: بازخورد انسانی و گزارش‌دهی جامع Advanced Evaluation: Human Feedback and Comprehensive Reporting

  • چرا تست‌های آماری اهمیت دارند Why Statistical Testing Matters

روش‌های ارزیابی کیفیت تصویر Image Quality Assessment Methods

  • پادکست: مشکلات پنهانی که معیارهای تصویر آشکار می‌کنند Podcast: The Hidden Problems Image Metrics Reveal

  • ارزیابی و خودکارسازی کیفیت تصویر با TorchMetrics Evaluating & Automating Image Quality with TorchMetrics

  • کیفیت پیشرفته تصویر: FID، CLIP و گیت‌های خودکار Advanced Image Quality: FID, CLIP & Automated Gates

ایجاد چارچوب‌های بنچ‌مارکینگ Creating Benchmarking Frameworks

  • پادکست: ارزش بنچ‌مارک‌ها در گردش کارهای هوش مصنوعی Podcast: The Value of Benchmarks in AI Workflows

  • تبدیل خروجی‌های مدل به مقایسه‌های معنادار Turning Model Outputs into Meaningful Comparisons

  • پادکست: جمع‌بندی نهایی: بنچ‌مارکینگی که اعتماد ایجاد می‌کند Podcast: Bringing It All Together: Benchmarking That Builds Trust

نمایش نظرات

آموزش ارزیابی مدل و بنچ‌مارکینگ
جزییات دوره
6h 53m
10
(آخرین آپدیت)
214
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده