لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش Fine-Tune و استقرار مدلهای LLM با QLoRA در Sagemaker و Streamlit
- آخرین آپدیت
دانلود Fine-Tune & Deploy LLMs with QLoRA on Sagemaker + Streamlit
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
تسلط بر ریاضیات QLoRA، آموزش Mixed Precision، کوانتایزاسیون دوگانه (Double Quantization)، توابع Lambda، API Gateway و استقرار با Streamlit
آموزش و Fine-Tune مدلهای زبانی بزرگ (LLMs) در AWS Sagemaker با استفاده از QLoRA و کوانتایزاسیون پیشرفته 4-بیتی روی مجموعه دادههای اختصاصی شما
ساخت یک اپلیکیشن تعاملی با Streamlit برای استقرار مدل Fine-tune شده با استفاده از Sagemaker، توابع Lambda و API Gateway
تسلط بر Fine-tuning مدلها با QLoRA — شامل تزریق آداپتور (adapter injection)، بهینهسازی حافظه، منجمد کردن پارامترها و مبانی ریاضیاتی آن
بهرهگیری از انواع محاسباتی bfloat16 برای آموزش سریعتر و بهینهتر روی GPUهای مدرن
درک آموزش Mixed Precision با qLoRA در محیط Sagemaker
استفاده از PEFT (آموزش بهینه پارامترها) برای شناسایی و تزریق دینامیک لایههای LoRA
درک کامل خط لوله (Pipeline) سطح پایین Fine-tuning — از مجموعه داده خام تا مدل آموزش دیده
استفاده از Double Quantization و دقت nf4 برای فشردهسازی مدلها بدون کاهش عملکرد
کشف نحوه کاهش شدید مصرف VRAM در هنگام آموزش با استفاده از Gradient Checkpointing
Fine-tune مدلهای بزرگ مانند Mixtral در Amazon SageMaker با استفاده از شتابدهندههای GPU پیشرفته
درک کدهای سفارشی Chunking برای مدلهای LLM
ادغام وزنهای LoRA و حذف آداپتورها برای خروجی نهایی مدل — آماده برای استقرار
استقرار مدل آموزش دیده در SageMaker Endpoints با استفاده از زیرساختهای عملیاتی آمازون
ساخت APIهای بلادرنگ برای LLM با استفاده از توابع Lambda و API Gateway
پیکربندی امن عملیات آموزش با استفاده از نقشهای IAM
مدیریت بودجه AWS، مدیریت سرور و قیمتگذاری
یادگیری نحوه استفاده از AWS Quotas برای دسترسی به GPUهای قدرتمند
پیش نیازها: آشنایی با زبان پایتون
جبر خطی مقدماتی (ضرب ماتریسها)
مدلهای زبانی بزرگ (LLMs) در حال بازتعریف توانمندیهای هوش مصنوعی هستند — از چتباتها گرفته تا تولید کد — اما مانع آموزش و استقرار آنها هنوز بالاست. سختافزارهای گرانقیمت، نیاز به حافظه عظیم و ابزارهای پیچیده اغلب مسیر را برای متخصصان مستقل و تیمهای کوچک میبندند. این دوره برای تغییر این وضعیت طراحی شده است.
در این آموزش کاربردی و کد-محور، یاد میگیرید چگونه مدلهایی مانند Mixtral-8x7B را با استفاده از QLoRA Fine-tune کنید — روشی پیشرفته که با ترکیب کوانتایزاسیون 4-بیتی، آداپتورهای LoRA و کوانتایزاسیون دوگانه، آموزش بهینه را ممکن میسازد. همچنین درک عمیقی از حسابات کوانتایز شده، فرمتهای ممیز شناور (مانند bfloat16 و INT8) و تأثیر آنها بر اندازه مدل، پهنای باند حافظه و عملیات ضرب ماتریسی به دست خواهید آورد.
شما کدهای پیشرفته پایتون را برای پیشپردازش مجموعه دادهها با استراتژیهای Chunking سفارشی مینویسید، لایههای قابل کوانتایز را به صورت دینامیک شناسایی میکنید و ماژولهای آداپتور را با استفاده از کتابخانه PEFT تزریق میکنید. سپس جابهای آموزش توزیعشده در AWS SageMaker را پیکربندی و اجرا کرده و با استفاده از Gradient Checkpointing، آموزش Mixed-precision و کوانتایزاسیون bitsandbytes آنها را بهینه میکنید.
پس از آموزش، مسیر را تا استقرار کامل طی خواهید کرد: ادغام وزنهای آداپتور، ذخیره مدل برای استنتاج و استقرار آن از طریق SageMaker Endpoints. سپس مدل خود را از طریق یک تابع AWS Lambda و API Gateway در دسترس قرار داده و در نهایت، یک اپلیکیشن Streamlit برای ایجاد یک رابط کاربری مدرن و پاسخگو میسازید.
چه مهندس یادگیری ماشین باشید، چه توسعهدهنده بکاند یا متخصص AI، این دوره به شما میآموزد چگونه از مدلهای آزمایشگاهی به مدلهای LLM واقعی، مقیاسپذیر و آماده تولید تبدیل شوید و از ابزارهایی استفاده کنید که برترین شرکتهای امروز به آنها متکی هستند.
سرفصل ها و درس ها
معرفی دوره
Course Overview
چه چیزی میسازیم
What We Are Building
راهاندازی حساب AWS
Setting up Our AWS Account
ورود به AWS
Sign in to AWS
ایجاد کاربر IAM
Creating IAM User
ورود با کاربر جدید AWS
Signing in with new AWS User
اقدامات لازم در صورت هک شدن
What to Do In case you Get Hacked
پیکربندی محیط AWS Sagemaker
Setting Up AWS Sagemaker Environment
ایجاد یک Sagemaker Domain
Create a Sagemaker Domain
ورود به محیط Sagemaker
Logging into Our Sagemaker Environment
آشنایی با JupyterLab
Introduction to JupyterLab
منابع دوره
Course Resources
دسترسی به تمام منابع دوره در اینجا
Access all the Course Resources Here
جمعآوری، تکه تکه کردن (Chunking)، توکنایز کردن و آپلود دیتاست
Gathering, Chunking, Tokenizing and Uploading our Dataset
سشنهای Sagemaker، ریجنها و نقشهای IAM
Sagemaker Sessions, Regions, and IAM Roles
بررسی دیتاست از HuggingFace
Examining Our Dataset from HuggingFace
توکنایزاسیون و Word Embeddings
Tokenization and Word Embeddings
احراز هویت HuggingFace در Sagemaker
HuggingFace Authentication with Sagemaker
اعمال تابع Templating روی دیتاست
Applying the Templating Function to our Dataset
Attention Masks و Padding
Attention Masks and Padding
استفاده از Star Unpacking در پایتون
Star Unpacking with Python
مثال Chain Iterator، List Constructor و Attention Mask در پایتون
Chain Iterator, List Constructor and Attention Mask example with Python
درک مفهوم Batching
Understanding Batching
Slicing و Chunking دیتاست
Slicing and Chunking our Dataset
ساخت تابع Chunking سفارشی
Creating our Custom Chunking Function
توکنایز کردن دیتاست
Tokenizing our Dataset
اجرای تابع Chunking
Running our Chunking Function
درک کامل فرآیند Chunking
Understanding the Entire Chunking Process
آپلود دادههای آموزش به AWS S3
Uploading the Training Data to AWS S3
درک LoRA و راهاندازی HuggingFace Estimator
Understanding LoRA and Setting up HuggingFace Estimator
تنظیم هایپرپارامترها برای عملیات آموزش
Setting Up Hyperparameters for the Training Job
ایجاد HuggingFace Estimator در Sagemaker
Creating our HuggingFace Estimator in Sagemaker
مقدمهای بر Low rank adaptation (LoRA)
Introduction to Low-rank adaptation (LoRA)
مثال عددی LoRA
LoRA Numerical Example
خلاصه LoRA و محاسبه کاهش هزینهها
LoRA Summarization and Cost Saving Calculation
(اختیاری) مرور ضرب ماتریسی
(Optional) Matrix Multiplication Refresher
درک برنامهنویسی LoRA بخش اول
Understanding LoRA Programatically Part 1
درک برنامهنویسی LoRA بخش دوم
Understanding LoRA Programatically Part 2
بهبود سرعت آموزش با Bfloat 16
Improving Training Speed with Bfloat 16
مقایسه Bfloat16 در برابر Float32
Bfloat16 vs Float32
مقایسه برنامهنویسی Bfloat16 و Float32
Comparing Bfloat16 Vs Float32 Programatically
تنظیم اسکریپت آموزش QLoRA با Mixed Precision و کوانتایزاسیون دوگانه
Setting up the QLoRA Training Script with Mixed Precision & Double Quantization
تنظیم Importها و کتابخانهها برای اسکریپت آموزش
Setting up Imports and Libraries for the Train Script
تابع Argument Parsing بخش اول
Argument Parsing Function Part 1
تابع Argument Parsing بخش دوم
Argument Parsing Function Part 2
درک نکات مربوط به پارامترهای قابل آموزش
Understanding Trainable Parameters Caveats
مقدمهای بر کوانتایزاسیون
Introduction to Quantization
شناسایی لایههای قابل آموزش برای LoRA
Identifying Trainable Layers for LoRA
تنظیم Parameter Efficient Fine Tuning
Setting up Parameter Efficient Fine Tuning
پیادهسازی پیکربندی LoRA و آموزش Mixed Precision
Implement LoRA Configuration and Mixed Precision Training
نمایش نظرات