لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مبانی فاینتونی مدلهای زبانی کوچک (SLM): LoRA، کوانتیزاسیون و لبه (Edge)
- آخرین آپدیت
دانلود Fundamentals of SLM Fine-Tuning: LoRA, Quantization & Edge
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
درک مفاهیم LoRA، کوانتیزاسیون و استقرار محلی برای طراحی و مدیریت پروژههای هوش مصنوعی خصوصی روی دستگاه، بدون نیاز به کدنویسی
طراحی و فاینتونی مدلهای زبانی کوچک (1 تا 7 میلیارد پارامتر) بهطور اختصاصی برای دستگاههای لبه و موبایل، با ایجاد تعادل بین دقت، اندازه و تأخیر
بهکارگیری LoRA و QLoRA برای فاینتونی SLMها روی GPUهای معمولی، جهت کاهش شدید نیاز به VRAM و زمان آموزش در پروژههای واقعی
کوانتیزه کردن مدلهای فاینتونی شده (INT8/INT4)، تبدیل آنها به فرمتهای مناسب برای لبه و استقرار روی گوشیها، تبلتها و رزبری پای
ساخت یک خط لوله (Pipeline) جامع از آمادهسازی دادهها و تنظیم هایپرپارامترها تا اعتبارسنجی روی دستگاه، بنچمارک و بهینهسازی
تصمیمگیری در مورد زمان استفاده از مهندسی پرامپت، RAG یا فاینتونی، و توجیه استقرار لبه در مقابل APIهای ابری برای کاربردهای مختلف تجاری
انتخاب خانواده مناسب SLM (مانند Gemma، Phi، Llama، Mistral) بر اساس محدودیتهای VRAM، سختافزار، حریم خصوصی و عملکرد روی دستگاه
طراحی مجموعهدادههای دستوری (Instruction Datasets) با کیفیت بالا و تقسیمبندی آنها برای جلوگیری از بیشبرازش (Overfitting) و فراموشی فاجعهبار در مدلهای کوچک و تخصصی
بستهبندی، نسخهبندی و بهروزرسانی مدلهای روی دستگاه (آداپتورهای یکپارچه در مقابل ماژولار) برای اپلیکیشنهای واقعی مانند طبقهبندی، رباتهای پشتیبانی و تولید محتوا
پیش نیازها: داشتن درکی کلی از هوش مصنوعی یا مدلهای سبک ChatGPT مفید است، اما دوره شامل یک مرور مفهومی سریع است تا مبتدیان مشتاق بتوانند آن را دنبال کنند
دسترسی به یک کامپیوتر (ویندوز، مک یا لینوکس) برای نصب پایتون و کتابخانههای رایج هوش مصنوعی؛ نیازی به تجربه قبلی در نصب و راهاندازی نیست
دانش پایه پایتون (متغیرها، توابع و اجرای اسکریپتهای ساده) مفید است اما الزامی نیست؛ تمامی کدها گامبهگام توضیح داده میشوند
این دوره یک چارچوب فنی جامع برای فاینتونی مدلهای زبانی کوچک (SLMs) و استقرار آنها روی دستگاههای لبه (Edge Devices) ارائه میدهد.
با عبور از هیاهوی مدلهای ابری عظیم، این راهنما بر واقعیتهای مهندسی اجرای هوش مصنوعی خصوصی و آفلاین تمرکز دارد. شما متدولوژی جامع تبدیل مدلهای عمومی (1 تا 7 میلیارد پارامتر) به ابزارهای تخصصی و کارآمدی را میآموزید که مستقیماً روی سختافزار کاربر و بدون وابستگی به اینترنت یا APIهای خارجی اجرا میشوند.
آنچه خواهید آموخت:
تغییر استراتژیک به سمت Edge AI: درک توازنهای معماری بین ابر و لبه. ما دقیقاً تحلیل میکنیم که چه زمانی باید پردازش را به دستگاه منتقل کنیم تا مشکلاتی مانند تأخیر، حریم خصوصی دادهها و هزینههای جاری ابری حل شوند.
بررسی عمیق مدلهای زبانی کوچک (SLMs): تحلیل فنی چشمانداز SLMها (Phi, Gemma, Llama, Mistral) و اینکه چرا معماری آنها برای گوشیهای هوشمند، تبلتها و سیستمهای جاسازی شده IoT مناسب است.
تکنیکهای بهینهسازی (بخش عملی): ما مکانیسمهای اصلی «فاینتونی بهینه از نظر پارامتر» (PEFT) را کالبدشکافی میکنیم. شما خواهید آموخت که LoRA و QLoRA چگونه مدلها را با استفاده از GPUهای معمولی تطبیق میدهند و کوانتیزاسیون (INT4/INT8) چگونه اندازه مدل را بدون تخریب عملکرد کاهش میدهد.
خط لوله استقرار: نگاهی گامبهگام به چرخه حیات یک مدل محلی: از آمادهسازی مجموعه داده و انتخاب هایپرپارامترها تا تبدیل به فرمتهای مناسب لبه (مانند GGUF یا ONNX).
سناریوهای تولید در دنیای واقعی: بررسی موردهای عینی از جمله طبقهبندی اسناد سازمانی و دستیارهای پشتیبانی آفلاین برای ارزیابی عملکرد این سیستمها از نظر مصرف حافظه، عمر باتری و سرعت استنتاج.
این دوره برای چه کسانی است: این دوره برای معماران هوش مصنوعی، مدیران فنی و مهندسانی طراحی شده است که به یک نقشه راه روشن و درک مفهومی برای طراحی، آموزش و عرضه سیستمهای هوش مصنوعی روی دستگاه نیاز دارند و میخواهند از تئوری به استراتژیهای آماده تولید حرکت کنند.
سرفصل ها و درس ها
مبانی و زمینهها
FOUNDATIONS AND CONTEXT
چرا فاینتونی در لبه؟
Why Fine-Tuning on Edge
مروری بر مدلهای زبانی کوچک
Small Language Models - Recap
نمایش نظرات