لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش معماری استنتاج و سروینگ هوش مصنوعی مولد (GenAI)
- آخرین آپدیت
دانلود GenAI Inference and Serving Architecture
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
استقرار بهینه مدلهای زبانی بزرگ (LLM) به دلیل نیازهای محاسباتی بالا، رفتارهای پیچیده نمونهبرداری و بهینهسازیهای سریع در حوزه استنتاج، چالشی بزرگ است.
در این دوره آموزشی با عنوان «معماری استنتاج و سروینگ GenAI»، شما توانایی طراحی، تحلیل و بهینهسازی خط لولههای استنتاج با کارایی بالا برای مدلهای ترنسفورمر را کسب خواهید کرد.
در ابتدا، مفاهیم بنیادی استنتاج مدل، از جمله توکنایزیشن (Tokenization)، گذرهای پیشرو (Forward Passes)، استراتژیهای نمونهبرداری و معیارهای کلیدی عملکرد که بر تأخیر (Latency) و نرخ تراکم (Throughput) اثر میگذارند را بررسی میکنید.
سپس، نحوه پیادهسازی دستهبندی (Batching)، مدیریت KV-cache و تکنیکهای بهینهسازی بافتار طولانی (Long-context) را برای بهبود چشمگیر کارایی در مقیاس بالا خواهید آموخت.
در نهایت، روشهای بهینهسازی بهرهوری GPU، مدیریت هزینههای زیرساختی و بهکارگیری تکنیکهای پیشرفتهای مانند رمزگشایی گمانهزن (Speculative Decoding)، کوانتیزاسیون (Quantization) و فشردهسازی مدل را فرا خواهید گرفت.
پس از اتمام این دوره، شما مهارتها و دانش لازم برای بهینهسازی استنتاج LLM را خواهید داشت تا بتوانید سیستمهای GenAI کمهزینه و با کارایی بالا را در محیط عملیاتی (Production) بسازید، تنظیم و مقیاسبندی کنید.
سرفصل ها و درس ها
استنتاج مدل و انتخاب بهینه مدل
Model Inference and Efficient Model Selection
آشنایی با استنتاج مدل
Introduction to Model Inference
فرآیند استنتاج ترنسفورمر
Transformer Inference Process
پارامترهای نمونهبرداری و اثرات آنها
Sampling Parameters and Effects
معیارهای کلیدی عملکرد
Key Performance Metrics
اندازه مدل، بافتار و طول تولید متن
Model Size, Context, and Generation Length
استنتاج بافتار طولانی و KV cache
Long-context Inference and KV-cache
بهینهسازی استنتاج
Inference Optimization
بهینهسازی دستهبندی و نرخ تراکم
Batching and Throughput Optimization
آشنایی با دستهبندی (Batching)
Introduction to Batching
نمایش نظرات