آموزش مبانی فاین‌تونی مدل‌های زبانی کوچک (SLM): LoRA، کوانتیزاسیون و لبه (Edge) - آخرین آپدیت

دانلود Fundamentals of SLM Fine-Tuning: LoRA, Quantization & Edge

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: درک مفاهیم LoRA، کوانتیزاسیون و استقرار محلی برای طراحی و مدیریت پروژه‌های هوش مصنوعی خصوصی روی دستگاه، بدون نیاز به کدنویسی طراحی و فاین‌تونی مدل‌های زبانی کوچک (1 تا 7 میلیارد پارامتر) به‌طور اختصاصی برای دستگاه‌های لبه و موبایل، با ایجاد تعادل بین دقت، اندازه و تأخیر به‌کارگیری LoRA و QLoRA برای فاین‌تونی SLMها روی GPUهای معمولی، جهت کاهش شدید نیاز به VRAM و زمان آموزش در پروژه‌های واقعی کوانتیزه کردن مدل‌های فاین‌تونی شده (INT8/INT4)، تبدیل آن‌ها به فرمت‌های مناسب برای لبه و استقرار روی گوشی‌ها، تبلت‌ها و رزبری پای ساخت یک خط لوله (Pipeline) جامع از آماده‌سازی داده‌ها و تنظیم هایپرپارامترها تا اعتبارسنجی روی دستگاه، بنچ‌مارک و بهینه‌سازی تصمیم‌گیری در مورد زمان استفاده از مهندسی پرامپت، RAG یا فاین‌تونی، و توجیه استقرار لبه در مقابل APIهای ابری برای کاربردهای مختلف تجاری انتخاب خانواده مناسب SLM (مانند Gemma، Phi، Llama، Mistral) بر اساس محدودیت‌های VRAM، سخت‌افزار، حریم خصوصی و عملکرد روی دستگاه طراحی مجموعه‌داده‌های دستوری (Instruction Datasets) با کیفیت بالا و تقسیم‌بندی آن‌ها برای جلوگیری از بیش‌برازش (Overfitting) و فراموشی فاجعه‌بار در مدل‌های کوچک و تخصصی بسته‌بندی، نسخه‌بندی و به‌روزرسانی مدل‌های روی دستگاه (آداپتورهای یکپارچه در مقابل ماژولار) برای اپلیکیشن‌های واقعی مانند طبقه‌بندی، ربات‌های پشتیبانی و تولید محتوا پیش نیازها: داشتن درکی کلی از هوش مصنوعی یا مدل‌های سبک ChatGPT مفید است، اما دوره شامل یک مرور مفهومی سریع است تا مبتدیان مشتاق بتوانند آن را دنبال کنند دسترسی به یک کامپیوتر (ویندوز، مک یا لینوکس) برای نصب پایتون و کتابخانه‌های رایج هوش مصنوعی؛ نیازی به تجربه قبلی در نصب و راه‌اندازی نیست دانش پایه پایتون (متغیرها، توابع و اجرای اسکریپت‌های ساده) مفید است اما الزامی نیست؛ تمامی کدها گام‌به‌گام توضیح داده می‌شوند

این دوره یک چارچوب فنی جامع برای فاین‌تونی مدل‌های زبانی کوچک (SLMs) و استقرار آن‌ها روی دستگاه‌های لبه (Edge Devices) ارائه می‌دهد.

با عبور از هیاهوی مدل‌های ابری عظیم، این راهنما بر واقعیت‌های مهندسی اجرای هوش مصنوعی خصوصی و آفلاین تمرکز دارد. شما متدولوژی جامع تبدیل مدل‌های عمومی (1 تا 7 میلیارد پارامتر) به ابزارهای تخصصی و کارآمدی را می‌آموزید که مستقیماً روی سخت‌افزار کاربر و بدون وابستگی به اینترنت یا APIهای خارجی اجرا می‌شوند.

آنچه خواهید آموخت:

تغییر استراتژیک به سمت Edge AI: درک توازن‌های معماری بین ابر و لبه. ما دقیقاً تحلیل می‌کنیم که چه زمانی باید پردازش را به دستگاه منتقل کنیم تا مشکلاتی مانند تأخیر، حریم خصوصی داده‌ها و هزینه‌های جاری ابری حل شوند.
بررسی عمیق مدل‌های زبانی کوچک (SLMs): تحلیل فنی چشم‌انداز SLMها (Phi, Gemma, Llama, Mistral) و اینکه چرا معماری آن‌ها برای گوشی‌های هوشمند، تبلت‌ها و سیستم‌های جاسازی شده IoT مناسب است.
تکنیک‌های بهینه‌سازی (بخش عملی): ما مکانیسم‌های اصلی «فاین‌تونی بهینه از نظر پارامتر» (PEFT) را کالبدشکافی می‌کنیم. شما خواهید آموخت که LoRA و QLoRA چگونه مدل‌ها را با استفاده از GPUهای معمولی تطبیق می‌دهند و کوانتیزاسیون (INT4/INT8) چگونه اندازه مدل را بدون تخریب عملکرد کاهش می‌دهد.
خط لوله استقرار: نگاهی گام‌به‌گام به چرخه حیات یک مدل محلی: از آماده‌سازی مجموعه داده و انتخاب هایپرپارامترها تا تبدیل به فرمت‌های مناسب لبه (مانند GGUF یا ONNX).
سناریوهای تولید در دنیای واقعی: بررسی موردهای عینی از جمله طبقه‌بندی اسناد سازمانی و دستیارهای پشتیبانی آفلاین برای ارزیابی عملکرد این سیستم‌ها از نظر مصرف حافظه، عمر باتری و سرعت استنتاج.

این دوره برای چه کسانی است: این دوره برای معماران هوش مصنوعی، مدیران فنی و مهندسانی طراحی شده است که به یک نقشه راه روشن و درک مفهومی برای طراحی، آموزش و عرضه سیستم‌های هوش مصنوعی روی دستگاه نیاز دارند و می‌خواهند از تئوری به استراتژی‌های آماده تولید حرکت کنند.

سرفصل ها و درس ها