آموزش Fine-Tune و استقرار مدل‌های LLM با QLoRA در Sagemaker و Streamlit - آخرین آپدیت

دانلود Fine-Tune & Deploy LLMs with QLoRA on Sagemaker + Streamlit

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: تسلط بر ریاضیات QLoRA، آموزش Mixed Precision، کوانتایزاسیون دوگانه (Double Quantization)، توابع Lambda، API Gateway و استقرار با Streamlit آموزش و Fine-Tune مدل‌های زبانی بزرگ (LLMs) در AWS Sagemaker با استفاده از QLoRA و کوانتایزاسیون پیشرفته 4-بیتی روی مجموعه داده‌های اختصاصی شما ساخت یک اپلیکیشن تعاملی با Streamlit برای استقرار مدل Fine-tune شده با استفاده از Sagemaker، توابع Lambda و API Gateway تسلط بر Fine-tuning مدل‌ها با QLoRA — شامل تزریق آداپتور (adapter injection)، بهینه‌سازی حافظه، منجمد کردن پارامترها و مبانی ریاضیاتی آن بهره‌گیری از انواع محاسباتی bfloat16 برای آموزش سریع‌تر و بهینه‌تر روی GPUهای مدرن درک آموزش Mixed Precision با qLoRA در محیط Sagemaker استفاده از PEFT (آموزش بهینه پارامترها) برای شناسایی و تزریق دینامیک لایه‌های LoRA درک کامل خط لوله (Pipeline) سطح پایین Fine-tuning — از مجموعه داده خام تا مدل آموزش دیده استفاده از Double Quantization و دقت nf4 برای فشرده‌سازی مدل‌ها بدون کاهش عملکرد کشف نحوه کاهش شدید مصرف VRAM در هنگام آموزش با استفاده از Gradient Checkpointing Fine-tune مدل‌های بزرگ مانند Mixtral در Amazon SageMaker با استفاده از شتاب‌دهنده‌های GPU پیشرفته درک کدهای سفارشی Chunking برای مدل‌های LLM ادغام وزن‌های LoRA و حذف آداپتورها برای خروجی نهایی مدل — آماده برای استقرار استقرار مدل آموزش دیده در SageMaker Endpoints با استفاده از زیرساخت‌های عملیاتی آمازون ساخت APIهای بلادرنگ برای LLM با استفاده از توابع Lambda و API Gateway پیکربندی امن عملیات آموزش با استفاده از نقش‌های IAM مدیریت بودجه AWS، مدیریت سرور و قیمت‌گذاری یادگیری نحوه استفاده از AWS Quotas برای دسترسی به GPUهای قدرتمند پیش نیازها: آشنایی با زبان پایتون جبر خطی مقدماتی (ضرب ماتریس‌ها)

مدل‌های زبانی بزرگ (LLMs) در حال بازتعریف توانمندی‌های هوش مصنوعی هستند — از چت‌بات‌ها گرفته تا تولید کد — اما مانع آموزش و استقرار آن‌ها هنوز بالاست. سخت‌افزارهای گران‌قیمت، نیاز به حافظه عظیم و ابزارهای پیچیده اغلب مسیر را برای متخصصان مستقل و تیم‌های کوچک می‌بندند. این دوره برای تغییر این وضعیت طراحی شده است.

در این آموزش کاربردی و کد-محور، یاد می‌گیرید چگونه مدل‌هایی مانند Mixtral-8x7B را با استفاده از QLoRA Fine-tune کنید — روشی پیشرفته که با ترکیب کوانتایزاسیون 4-بیتی، آداپتورهای LoRA و کوانتایزاسیون دوگانه، آموزش بهینه را ممکن می‌سازد. همچنین درک عمیقی از حسابات کوانتایز شده، فرمت‌های ممیز شناور (مانند bfloat16 و INT8) و تأثیر آن‌ها بر اندازه مدل، پهنای باند حافظه و عملیات ضرب ماتریسی به دست خواهید آورد.

شما کدهای پیشرفته پایتون را برای پیش‌پردازش مجموعه‌ داده‌ها با استراتژی‌های Chunking سفارشی می‌نویسید، لایه‌های قابل کوانتایز را به صورت دینامیک شناسایی می‌کنید و ماژول‌های آداپتور را با استفاده از کتابخانه PEFT تزریق می‌کنید. سپس جاب‌های آموزش توزیع‌شده در AWS SageMaker را پیکربندی و اجرا کرده و با استفاده از Gradient Checkpointing، آموزش Mixed-precision و کوانتایزاسیون bitsandbytes آن‌ها را بهینه می‌کنید.

پس از آموزش، مسیر را تا استقرار کامل طی خواهید کرد: ادغام وزن‌های آداپتور، ذخیره مدل برای استنتاج و استقرار آن از طریق SageMaker Endpoints. سپس مدل خود را از طریق یک تابع AWS Lambda و API Gateway در دسترس قرار داده و در نهایت، یک اپلیکیشن Streamlit برای ایجاد یک رابط کاربری مدرن و پاسخ‌گو می‌سازید.

چه مهندس یادگیری ماشین باشید، چه توسعه‌دهنده بک‌اند یا متخصص AI، این دوره به شما می‌آموزد چگونه از مدل‌های آزمایشگاهی به مدل‌های LLM واقعی، مقیاس‌پذیر و آماده تولید تبدیل شوید و از ابزارهایی استفاده کنید که برترین شرکت‌های امروز به آن‌ها متکی هستند.


سرفصل ها و درس ها

معرفی دوره Course Overview

  • چه چیزی می‌سازیم What We Are Building

راه‌اندازی حساب AWS Setting up Our AWS Account

  • ورود به AWS Sign in to AWS

  • ایجاد کاربر IAM Creating IAM User

  • ورود با کاربر جدید AWS Signing in with new AWS User

  • اقدامات لازم در صورت هک شدن What to Do In case you Get Hacked

پیکربندی محیط AWS Sagemaker Setting Up AWS Sagemaker Environment

  • ایجاد یک Sagemaker Domain Create a Sagemaker Domain

  • ورود به محیط Sagemaker Logging into Our Sagemaker Environment

  • آشنایی با JupyterLab Introduction to JupyterLab

منابع دوره Course Resources

  • دسترسی به تمام منابع دوره در اینجا Access all the Course Resources Here

جمع‌آوری، تکه تکه کردن (Chunking)، توکنایز کردن و آپلود دیتاست Gathering, Chunking, Tokenizing and Uploading our Dataset

  • سشن‌های Sagemaker، ریجن‌ها و نقش‌های IAM Sagemaker Sessions, Regions, and IAM Roles

  • بررسی دیتاست از HuggingFace Examining Our Dataset from HuggingFace

  • توکنایزاسیون و Word Embeddings Tokenization and Word Embeddings

  • احراز هویت HuggingFace در Sagemaker HuggingFace Authentication with Sagemaker

  • اعمال تابع Templating روی دیتاست Applying the Templating Function to our Dataset

  • Attention Masks و Padding Attention Masks and Padding

  • استفاده از Star Unpacking در پایتون Star Unpacking with Python

  • مثال Chain Iterator، List Constructor و Attention Mask در پایتون Chain Iterator, List Constructor and Attention Mask example with Python

  • درک مفهوم Batching Understanding Batching

  • Slicing و Chunking دیتاست Slicing and Chunking our Dataset

  • ساخت تابع Chunking سفارشی Creating our Custom Chunking Function

  • توکنایز کردن دیتاست Tokenizing our Dataset

  • اجرای تابع Chunking Running our Chunking Function

  • درک کامل فرآیند Chunking Understanding the Entire Chunking Process

  • آپلود داده‌های آموزش به AWS S3 Uploading the Training Data to AWS S3

درک LoRA و راه‌اندازی HuggingFace Estimator Understanding LoRA and Setting up HuggingFace Estimator

  • تنظیم هایپرپارامترها برای عملیات آموزش Setting Up Hyperparameters for the Training Job

  • ایجاد HuggingFace Estimator در Sagemaker Creating our HuggingFace Estimator in Sagemaker

  • مقدمه‌ای بر Low rank adaptation (LoRA) Introduction to Low-rank adaptation (LoRA)

  • مثال عددی LoRA LoRA Numerical Example

  • خلاصه LoRA و محاسبه کاهش هزینه‌ها LoRA Summarization and Cost Saving Calculation

  • (اختیاری) مرور ضرب ماتریسی (Optional) Matrix Multiplication Refresher

  • درک برنامه‌نویسی LoRA بخش اول Understanding LoRA Programatically Part 1

  • درک برنامه‌نویسی LoRA بخش دوم Understanding LoRA Programatically Part 2

بهبود سرعت آموزش با Bfloat 16 Improving Training Speed with Bfloat 16

  • مقایسه Bfloat16 در برابر Float32 Bfloat16 vs Float32

  • مقایسه برنامه‌نویسی Bfloat16 و Float32 Comparing Bfloat16 Vs Float32 Programatically

تنظیم اسکریپت آموزش QLoRA با Mixed Precision و کوانتایزاسیون دوگانه Setting up the QLoRA Training Script with Mixed Precision & Double Quantization

  • تنظیم Importها و کتابخانه‌ها برای اسکریپت آموزش Setting up Imports and Libraries for the Train Script

  • تابع Argument Parsing بخش اول Argument Parsing Function Part 1

  • تابع Argument Parsing بخش دوم Argument Parsing Function Part 2

  • درک نکات مربوط به پارامترهای قابل آموزش Understanding Trainable Parameters Caveats

  • مقدمه‌ای بر کوانتایزاسیون Introduction to Quantization

  • شناسایی لایه‌های قابل آموزش برای LoRA Identifying Trainable Layers for LoRA

  • تنظیم Parameter Efficient Fine Tuning Setting up Parameter Efficient Fine Tuning

  • پیاده‌سازی پیکربندی LoRA و آموزش Mixed Precision Implement LoRA Configuration and Mixed Precision Training

  • درک کوانتایزاسیون دوگانه (Double Quantization) Understanding Double Quantization

  • ساخت تابع آموزش بخش اول Creating the Training Function Part 1

  • ساخت تابع آموزش بخش دوم Creating the Training Function Part 2

  • تکمیل اسکریپت Sagemaker Finishing our Sagemaker Script

  • دسترسی به GPUهای قدرتمند با AWS Quotas Gaining Access to Powerful GPUs with AWS Quotas

  • اصلاحات نهایی قبل از آموزش Final Fixes Before Training

اجرای اسکریپت Fine-Tuning برای مدل LLM Running our Fine Tuning Script for our LLM

  • شروع عملیات آموزش Starting our Training Job

  • بررسی نتایج آموزش و مانیتورینگ با Cloudwatch Inspecting the Results of our Training Job and Monitoring with Cloudwatch

استقرار مدل LLM بهینه شده Deploying our Fine Tuned LLM

  • استقرار LLM در Sagemaker Endpoint Deploying our LLM to a Sagemaker Endpoint

  • تست محلی LLM در Sagemaker Testing our LLM in Sagemaker Locally

  • ساخت تابع Lambda برای فراخوانی Endpoint Creating the Lambda Function to Invoke our Endpoint

  • ساخت API Gateway برای استقرار مدل در اینترنت Creating API Gateway to Deploy the Model Through the Internet

  • پیاده‌سازی اپلیکیشن Streamlit Implementing our Streamlit App

  • اصلاحات اپلیکیشن Streamlit Streamlit App Correction

پاکسازی منابع Cleaning up Resources

  • تبریک و پاکسازی منابع AWS Congratulations and Cleaning up AWS Resources

نمایش نظرات

آموزش Fine-Tune و استقرار مدل‌های LLM با QLoRA در Sagemaker و Streamlit
جزییات دوره
7.5 hours
57
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
514
4.6 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Patrik Szepesi Patrik Szepesi

مهندس یادگیری ماشین