دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش ارزیابی مدل و بنچ‌مارکینگ - آخرین آپدیت

دانلود Model Evaluation and Benchmarking

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: دوره ارزیابی مدل و بنچ‌مارکینگ برای توسعه‌دهندگان، مهندسان و سازندگان محصولات فنی طراحی شده است که در حوزه هوش مصنوعی مولد (Generative AI) تازه‌کار هستند اما دارای دانش متوسط در یادگیری ماشین، تسلط پایه به پایتون و آشنایی با محیط‌های توسعه مانند VS Code می‌باشند و قصد دارند راهکارهای متن‌باز هوش مصنوعی مولد را مهندسی، سفارشی‌سازی و مستقر کنند تا از وابستگی به یک فروشنده خاص (Vendor Lock-in) جلوگیری نمایند. این دوره زبان‌آموزان را به مهارت‌های لازم برای سنجش و مقایسه عملکرد مدل‌های مولد متن و تصویر مجهز می‌کند. با شروع از ارزیابی متن، دانشجویان معیارهای استانداردی مانند Perplexity، BLEU، ROUGE و BERTScore را به کار می‌گیرند و همزمان پروتکل‌های ارزیابی انسانی و روش‌های خاص برای کاربردهایی مانند خلاصه‌سازی یا ترجمه را طراحی می‌کنند. سپس دوره به بررسی ارزیابی تصاویر با استفاده از معیارهای فنی از جمله FID، شباهت CLIP و SSIM، در کنار تکنیک‌های ارزیابی مبتنی بر ادراک انسانی و سیستم‌های تشخیص مصنوعات (Artifact Detection) می‌پردازد. در ماژول نهایی، زبان‌آموزان چارچوب‌های جامع بنچ‌مارکینگ را با محیط‌های تست تکرارپذیر، کنترل نسخه و داشبوردهای بصری برای نظارت مستمر طراحی می‌کنند. در پایان، کاربران قادر خواهند بود سیستم‌های ارزیابی خودکار و تخصصی را پیاده‌سازی کرده و گزارش‌های دقیق عملکردی ارائه دهند که تضمین می‌کند مدل‌های مولد با استانداردهای کیفی سخت‌گیرانه مطابقت دارند.

سرفصل ها و درس ها

معیارها و ابزارهای تولید متن Text Generation Metrics and Tools

پادکست: مشکلاتی که معیارهای متنی برای حل آن‌ها ساخته شدند Podcast: The Problems Text Metrics Were Built to Solve
اولین خط لوله ارزیابی شما با Hugging Face Your First Evaluation Pipeline with Hugging Face
ارزیابی پیشرفته: بازخورد انسانی و گزارش‌دهی جامع Advanced Evaluation: Human Feedback and Comprehensive Reporting
چرا تست‌های آماری اهمیت دارند Why Statistical Testing Matters

روش‌های ارزیابی کیفیت تصویر Image Quality Assessment Methods

پادکست: مشکلات پنهانی که معیارهای تصویر آشکار می‌کنند Podcast: The Hidden Problems Image Metrics Reveal
ارزیابی و خودکارسازی کیفیت تصویر با TorchMetrics Evaluating & Automating Image Quality with TorchMetrics
کیفیت پیشرفته تصویر: FID، CLIP و گیت‌های خودکار Advanced Image Quality: FID, CLIP & Automated Gates

ایجاد چارچوب‌های بنچ‌مارکینگ Creating Benchmarking Frameworks

پادکست: ارزش بنچ‌مارک‌ها در گردش کارهای هوش مصنوعی Podcast: The Value of Benchmarks in AI Workflows
تبدیل خروجی‌های مدل به مقایسه‌های معنادار Turning Model Outputs into Meaningful Comparisons
پادکست: جمع‌بندی نهایی: بنچ‌مارکینگی که اعتماد ایجاد می‌کند Podcast: Bringing It All Together: Benchmarking That Builds Trust

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

جزییات دوره

زمان دوره: 6h 53m

تعداد ویدیو ها: 10

شرکت: Coursera (کورسرا)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 214

امتیاز مرجع: - از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Chris Croft

لینک کوتاه این دوره

https://donyad.com/d/0a4678

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

بازاریابی

دیگر

علوم داده

فراگیری ماشین

آموزش ارزیابی مدل و بنچ‌مارکینگ - آخرین آپدیت

دانلود Model Evaluation and Benchmarking

معیارها و ابزارهای تولید متن Text Generation Metrics and Tools

پادکست: مشکلاتی که معیارهای متنی برای حل آن‌ها ساخته شدند Podcast: The Problems Text Metrics Were Built to Solve

اولین خط لوله ارزیابی شما با Hugging Face Your First Evaluation Pipeline with Hugging Face

ارزیابی پیشرفته: بازخورد انسانی و گزارش‌دهی جامع Advanced Evaluation: Human Feedback and Comprehensive Reporting

چرا تست‌های آماری اهمیت دارند Why Statistical Testing Matters

روش‌های ارزیابی کیفیت تصویر Image Quality Assessment Methods

پادکست: مشکلات پنهانی که معیارهای تصویر آشکار می‌کنند Podcast: The Hidden Problems Image Metrics Reveal

ارزیابی و خودکارسازی کیفیت تصویر با TorchMetrics Evaluating & Automating Image Quality with TorchMetrics

کیفیت پیشرفته تصویر: FID، CLIP و گیت‌های خودکار Advanced Image Quality: FID, CLIP & Automated Gates

ایجاد چارچوب‌های بنچ‌مارکینگ Creating Benchmarking Frameworks

پادکست: ارزش بنچ‌مارک‌ها در گردش کارهای هوش مصنوعی Podcast: The Value of Benchmarks in AI Workflows

تبدیل خروجی‌های مدل به مقایسه‌های معنادار Turning Model Outputs into Meaningful Comparisons

پادکست: جمع‌بندی نهایی: بنچ‌مارکینگی که اعتماد ایجاد می‌کند Podcast: Bringing It All Together: Benchmarking That Builds Trust

نمایش نظرات

https://donyad.com/d/0a4678

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar