آموزش بهینه‌سازی سرعت و دقت استنتاج هوش مصنوعی (AI Inference) - آخرین آپدیت

دانلود Optimize AI Inference Speed & Accuracy

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: آیا مدل‌های یادگیری ماشین شما در محیط عملیاتی (Production) با مشکل تأخیر (Latency) مواجه هستند؟ بیاموزید چگونه سرعت اجرای مدل‌ها را بدون کاهش دقت، ۳ تا ۵ برابر افزایش دهید. این دوره به مهندسان ML و دانشمندان داده کمک می‌کند تا استنتاج شبکه‌های عصبی را برای استقرار در دنیای واقعی — اعم از محیط‌های موبایل، Edge و کلاود — بهینه کنند. اگر با کندی استنتاج مدل، هزینه‌های بالای زیرساختی یا محدودیت‌های استقرار روبرو هستید، این دوره راهکارهای عملی را ارائه می‌دهد. شما تکنیک‌های پروفایلینگ (Profiling) را برای شناسایی گلوگاه‌های عملکردی یاد می‌گیرید، کوانتیزاسیون (Quantization) را برای کاهش نیاز به دقت محاسباتی اعمال می‌کنید و تعادلی هوشمندانه بین سرعت، دقت و محدودیت‌های منابع برقرار خواهید کرد. همچنین یاد می‌گیرید که تکنیک‌های بهینه‌سازی را بنچ‌مارک کرده و رویکرد مناسب را برای سناریوهای مختلف استقرار انتخاب کنید. در این مسیر، پروفایلینگ استنتاج و متریک‌ها، استراتژی‌های هرس کردن (Pruning) و متدهای کوانتیزاسیون را بررسی خواهید کرد و با استفاده از ابزارهای استاندارد صنعت مانند PyTorch Profiler، TensorRT و ابزارهای Pruning، روی کیس‌های واقعی — از پلتفرم‌های استریمینگ تا خودروهای خودران — تمرین می‌کنید. این دوره برای مهندسان یادگیری ماشین، دانشمندان داده و متخصصان AI که در حال استقرار یا بهینه‌سازی مدل‌ها در محیط عملیاتی هستند، ایده‌آل است. همچنین برای متخصصان MLOps و مهندسان سیستم که مسئول تنظیم عملکرد در محیط‌های با منابع محدود (مانند سیستم‌های استنتاج موبایل، تعبیه‌شده یا ابری) هستند، بسیار ارزشمند است. پیش‌نیازهای این دوره تسلط مناسب به زبان پایتون و تجربه پایه در کار با PyTorch یا TensorFlow است. آشنایی با مفاهیم یادگیری ماشین مانند آموزش و ارزیابی مدل ضروری است. درک نحوه عملکرد شبکه‌های عصبی و متریک‌های پایه عملکرد مانند تأخیر و دقت، به شما کمک می‌کند تا بیشترین بهره را از این دوره ببرید. در پایان این دوره، شما با اعتماد به نفس کامل مدل‌های عملیاتی را بهینه می‌کنید، هزینه‌های استنتاج را کاهش می‌دهید، اهداف مربوط به تأخیر را محقق می‌کنید و سیستم‌های ML را به گونه‌ای مستقر می‌کنید که به طور بهینه مقیاس‌پذیر باشند.

سرفصل ها و درس ها

مبانی: پروفایلینگ و شناسایی گلوگاه‌های استنتاج Foundations: Profiling and Understanding Inference Bottlenecks

  • مقدمه دوره: بهینه‌سازی سرعت و دقت استنتاج AI Course Intro: Optimize AI Inference Speed & Accuracy

  • درک گلوگاه‌های استنتاج Understanding Inference Bottlenecks

  • کار با ابزارهای پروفایلینگ Profiling Tools in Action

  • ارزیابی عملکرد استنتاج ML در محیط عملیاتی Evaluating ML Inference Performance in Production

هرس کردن مدل (Pruning): کاهش پیچیدگی بدون از دست دادن قدرت Model Pruning: Reducing Complexity Without Losing Power

  • تئوری و تکنیک‌های هرس کردن (Pruning) Pruning Theory and Techniques

  • پیاده‌سازی Pruning در PyTorch Implementing Pruning in PyTorch

  • استراتژی‌های بازتنظیم (Fine-tuning) و بازیابی Fine-tuning and Recovery Strategies

کوانتیزاسیون و استقرار امن: تلاقی سرعت و امنیت Quantization and Secure Deployment: Speed Meets Security

  • مبانی کوانتیزاسیون (Quantization) Quantization Fundamentals

  • پیاده‌سازی گردش‌کارهای کوانتیزاسیون Implementing Quantization Workflows

  • بنچ‌مارکینگ: مقایسه Pruning در مقابل Quantization Benchmarking: Pruning vs Quantization

  • تسلط نهایی بر بهینه‌سازی Your Optimization Mastery

نمایش نظرات

آموزش بهینه‌سازی سرعت و دقت استنتاج هوش مصنوعی (AI Inference)
جزییات دوره
4h 26m
11
(آخرین آپدیت)
226
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده