لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش ارزیابی مدل و بنچمارکینگ
- آخرین آپدیت
دانلود Model Evaluation and Benchmarking
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
دوره ارزیابی مدل و بنچمارکینگ برای توسعهدهندگان، مهندسان و سازندگان محصولات فنی طراحی شده است که در حوزه هوش مصنوعی مولد (Generative AI) تازهکار هستند اما دارای دانش متوسط در یادگیری ماشین، تسلط پایه به پایتون و آشنایی با محیطهای توسعه مانند VS Code میباشند و قصد دارند راهکارهای متنباز هوش مصنوعی مولد را مهندسی، سفارشیسازی و مستقر کنند تا از وابستگی به یک فروشنده خاص (Vendor Lock-in) جلوگیری نمایند.
این دوره زبانآموزان را به مهارتهای لازم برای سنجش و مقایسه عملکرد مدلهای مولد متن و تصویر مجهز میکند. با شروع از ارزیابی متن، دانشجویان معیارهای استانداردی مانند Perplexity، BLEU، ROUGE و BERTScore را به کار میگیرند و همزمان پروتکلهای ارزیابی انسانی و روشهای خاص برای کاربردهایی مانند خلاصهسازی یا ترجمه را طراحی میکنند. سپس دوره به بررسی ارزیابی تصاویر با استفاده از معیارهای فنی از جمله FID، شباهت CLIP و SSIM، در کنار تکنیکهای ارزیابی مبتنی بر ادراک انسانی و سیستمهای تشخیص مصنوعات (Artifact Detection) میپردازد. در ماژول نهایی، زبانآموزان چارچوبهای جامع بنچمارکینگ را با محیطهای تست تکرارپذیر، کنترل نسخه و داشبوردهای بصری برای نظارت مستمر طراحی میکنند. در پایان، کاربران قادر خواهند بود سیستمهای ارزیابی خودکار و تخصصی را پیادهسازی کرده و گزارشهای دقیق عملکردی ارائه دهند که تضمین میکند مدلهای مولد با استانداردهای کیفی سختگیرانه مطابقت دارند.
سرفصل ها و درس ها
معیارها و ابزارهای تولید متن
Text Generation Metrics and Tools
پادکست: مشکلاتی که معیارهای متنی برای حل آنها ساخته شدند
Podcast: The Problems Text Metrics Were Built to Solve
اولین خط لوله ارزیابی شما با Hugging Face
Your First Evaluation Pipeline with Hugging Face
ارزیابی پیشرفته: بازخورد انسانی و گزارشدهی جامع
Advanced Evaluation: Human Feedback and Comprehensive Reporting
چرا تستهای آماری اهمیت دارند
Why Statistical Testing Matters
نمایش نظرات