دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش Fine-Tune و استقرار مدل‌های LLM با QLoRA در Sagemaker و Streamlit - آخرین آپدیت

دانلود Fine-Tune & Deploy LLMs with QLoRA on Sagemaker + Streamlit bestseller

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: تسلط بر ریاضیات QLoRA، آموزش Mixed Precision، کوانتایزاسیون دوگانه (Double Quantization)، توابع Lambda، API Gateway و استقرار با Streamlit آموزش و Fine-Tune مدل‌های زبانی بزرگ (LLMs) در AWS Sagemaker با استفاده از QLoRA و کوانتایزاسیون پیشرفته 4-بیتی روی مجموعه داده‌های اختصاصی شما ساخت یک اپلیکیشن تعاملی با Streamlit برای استقرار مدل Fine-tune شده با استفاده از Sagemaker، توابع Lambda و API Gateway تسلط بر Fine-tuning مدل‌ها با QLoRA — شامل تزریق آداپتور (adapter injection)، بهینه‌سازی حافظه، منجمد کردن پارامترها و مبانی ریاضیاتی آن بهره‌گیری از انواع محاسباتی bfloat16 برای آموزش سریع‌تر و بهینه‌تر روی GPUهای مدرن درک آموزش Mixed Precision با qLoRA در محیط Sagemaker استفاده از PEFT (آموزش بهینه پارامترها) برای شناسایی و تزریق دینامیک لایه‌های LoRA درک کامل خط لوله (Pipeline) سطح پایین Fine-tuning — از مجموعه داده خام تا مدل آموزش دیده استفاده از Double Quantization و دقت nf4 برای فشرده‌سازی مدل‌ها بدون کاهش عملکرد کشف نحوه کاهش شدید مصرف VRAM در هنگام آموزش با استفاده از Gradient Checkpointing Fine-tune مدل‌های بزرگ مانند Mixtral در Amazon SageMaker با استفاده از شتاب‌دهنده‌های GPU پیشرفته درک کدهای سفارشی Chunking برای مدل‌های LLM ادغام وزن‌های LoRA و حذف آداپتورها برای خروجی نهایی مدل — آماده برای استقرار استقرار مدل آموزش دیده در SageMaker Endpoints با استفاده از زیرساخت‌های عملیاتی آمازون ساخت APIهای بلادرنگ برای LLM با استفاده از توابع Lambda و API Gateway پیکربندی امن عملیات آموزش با استفاده از نقش‌های IAM مدیریت بودجه AWS، مدیریت سرور و قیمت‌گذاری یادگیری نحوه استفاده از AWS Quotas برای دسترسی به GPUهای قدرتمند پیش نیازها: آشنایی با زبان پایتون جبر خطی مقدماتی (ضرب ماتریس‌ها)

مدل‌های زبانی بزرگ (LLMs) در حال بازتعریف توانمندی‌های هوش مصنوعی هستند — از چت‌بات‌ها گرفته تا تولید کد — اما مانع آموزش و استقرار آن‌ها هنوز بالاست. سخت‌افزارهای گران‌قیمت، نیاز به حافظه عظیم و ابزارهای پیچیده اغلب مسیر را برای متخصصان مستقل و تیم‌های کوچک می‌بندند. این دوره برای تغییر این وضعیت طراحی شده است.

در این آموزش کاربردی و کد-محور، یاد می‌گیرید چگونه مدل‌هایی مانند Mixtral-8x7B را با استفاده از QLoRA Fine-tune کنید — روشی پیشرفته که با ترکیب کوانتایزاسیون 4-بیتی، آداپتورهای LoRA و کوانتایزاسیون دوگانه، آموزش بهینه را ممکن می‌سازد. همچنین درک عمیقی از حسابات کوانتایز شده، فرمت‌های ممیز شناور (مانند bfloat16 و INT8) و تأثیر آن‌ها بر اندازه مدل، پهنای باند حافظه و عملیات ضرب ماتریسی به دست خواهید آورد.

شما کدهای پیشرفته پایتون را برای پیش‌پردازش مجموعه‌ داده‌ها با استراتژی‌های Chunking سفارشی می‌نویسید، لایه‌های قابل کوانتایز را به صورت دینامیک شناسایی می‌کنید و ماژول‌های آداپتور را با استفاده از کتابخانه PEFT تزریق می‌کنید. سپس جاب‌های آموزش توزیع‌شده در AWS SageMaker را پیکربندی و اجرا کرده و با استفاده از Gradient Checkpointing، آموزش Mixed-precision و کوانتایزاسیون bitsandbytes آن‌ها را بهینه می‌کنید.

پس از آموزش، مسیر را تا استقرار کامل طی خواهید کرد: ادغام وزن‌های آداپتور، ذخیره مدل برای استنتاج و استقرار آن از طریق SageMaker Endpoints. سپس مدل خود را از طریق یک تابع AWS Lambda و API Gateway در دسترس قرار داده و در نهایت، یک اپلیکیشن Streamlit برای ایجاد یک رابط کاربری مدرن و پاسخ‌گو می‌سازید.

چه مهندس یادگیری ماشین باشید، چه توسعه‌دهنده بک‌اند یا متخصص AI، این دوره به شما می‌آموزد چگونه از مدل‌های آزمایشگاهی به مدل‌های LLM واقعی، مقیاس‌پذیر و آماده تولید تبدیل شوید و از ابزارهایی استفاده کنید که برترین شرکت‌های امروز به آن‌ها متکی هستند.

سرفصل ها و درس ها

معرفی دوره Course Overview

چه چیزی می‌سازیم What We Are Building

راه‌اندازی حساب AWS Setting up Our AWS Account

ورود به AWS Sign in to AWS
ایجاد کاربر IAM Creating IAM User
ورود با کاربر جدید AWS Signing in with new AWS User
اقدامات لازم در صورت هک شدن What to Do In case you Get Hacked

پیکربندی محیط AWS Sagemaker Setting Up AWS Sagemaker Environment

ایجاد یک Sagemaker Domain Create a Sagemaker Domain
ورود به محیط Sagemaker Logging into Our Sagemaker Environment
آشنایی با JupyterLab Introduction to JupyterLab

منابع دوره Course Resources

دسترسی به تمام منابع دوره در اینجا Access all the Course Resources Here

جمع‌آوری، تکه تکه کردن (Chunking)، توکنایز کردن و آپلود دیتاست Gathering, Chunking, Tokenizing and Uploading our Dataset

سشن‌های Sagemaker، ریجن‌ها و نقش‌های IAM Sagemaker Sessions, Regions, and IAM Roles
بررسی دیتاست از HuggingFace Examining Our Dataset from HuggingFace
توکنایزاسیون و Word Embeddings Tokenization and Word Embeddings
احراز هویت HuggingFace در Sagemaker HuggingFace Authentication with Sagemaker
اعمال تابع Templating روی دیتاست Applying the Templating Function to our Dataset
Attention Masks و Padding Attention Masks and Padding
استفاده از Star Unpacking در پایتون Star Unpacking with Python
مثال Chain Iterator، List Constructor و Attention Mask در پایتون Chain Iterator, List Constructor and Attention Mask example with Python
درک مفهوم Batching Understanding Batching
Slicing و Chunking دیتاست Slicing and Chunking our Dataset
ساخت تابع Chunking سفارشی Creating our Custom Chunking Function
توکنایز کردن دیتاست Tokenizing our Dataset
اجرای تابع Chunking Running our Chunking Function
درک کامل فرآیند Chunking Understanding the Entire Chunking Process
آپلود داده‌های آموزش به AWS S3 Uploading the Training Data to AWS S3

درک LoRA و راه‌اندازی HuggingFace Estimator Understanding LoRA and Setting up HuggingFace Estimator

تنظیم هایپرپارامترها برای عملیات آموزش Setting Up Hyperparameters for the Training Job
ایجاد HuggingFace Estimator در Sagemaker Creating our HuggingFace Estimator in Sagemaker
مقدمه‌ای بر Low rank adaptation (LoRA) Introduction to Low-rank adaptation (LoRA)
مثال عددی LoRA LoRA Numerical Example
خلاصه LoRA و محاسبه کاهش هزینه‌ها LoRA Summarization and Cost Saving Calculation
(اختیاری) مرور ضرب ماتریسی (Optional) Matrix Multiplication Refresher
درک برنامه‌نویسی LoRA بخش اول Understanding LoRA Programatically Part 1
درک برنامه‌نویسی LoRA بخش دوم Understanding LoRA Programatically Part 2

بهبود سرعت آموزش با Bfloat 16 Improving Training Speed with Bfloat 16

مقایسه Bfloat16 در برابر Float32 Bfloat16 vs Float32
مقایسه برنامه‌نویسی Bfloat16 و Float32 Comparing Bfloat16 Vs Float32 Programatically

تنظیم اسکریپت آموزش QLoRA با Mixed Precision و کوانتایزاسیون دوگانه Setting up the QLoRA Training Script with Mixed Precision & Double Quantization

تنظیم Importها و کتابخانه‌ها برای اسکریپت آموزش Setting up Imports and Libraries for the Train Script
تابع Argument Parsing بخش اول Argument Parsing Function Part 1
تابع Argument Parsing بخش دوم Argument Parsing Function Part 2
درک نکات مربوط به پارامترهای قابل آموزش Understanding Trainable Parameters Caveats
مقدمه‌ای بر کوانتایزاسیون Introduction to Quantization
شناسایی لایه‌های قابل آموزش برای LoRA Identifying Trainable Layers for LoRA
تنظیم Parameter Efficient Fine Tuning Setting up Parameter Efficient Fine Tuning
پیاده‌سازی پیکربندی LoRA و آموزش Mixed Precision Implement LoRA Configuration and Mixed Precision Training
درک کوانتایزاسیون دوگانه (Double Quantization) Understanding Double Quantization
ساخت تابع آموزش بخش اول Creating the Training Function Part 1
ساخت تابع آموزش بخش دوم Creating the Training Function Part 2
تکمیل اسکریپت Sagemaker Finishing our Sagemaker Script
دسترسی به GPUهای قدرتمند با AWS Quotas Gaining Access to Powerful GPUs with AWS Quotas
اصلاحات نهایی قبل از آموزش Final Fixes Before Training

اجرای اسکریپت Fine-Tuning برای مدل LLM Running our Fine Tuning Script for our LLM

شروع عملیات آموزش Starting our Training Job
بررسی نتایج آموزش و مانیتورینگ با Cloudwatch Inspecting the Results of our Training Job and Monitoring with Cloudwatch

استقرار مدل LLM بهینه شده Deploying our Fine Tuned LLM

استقرار LLM در Sagemaker Endpoint Deploying our LLM to a Sagemaker Endpoint
تست محلی LLM در Sagemaker Testing our LLM in Sagemaker Locally
ساخت تابع Lambda برای فراخوانی Endpoint Creating the Lambda Function to Invoke our Endpoint
ساخت API Gateway برای استقرار مدل در اینترنت Creating API Gateway to Deploy the Model Through the Internet
پیاده‌سازی اپلیکیشن Streamlit Implementing our Streamlit App
اصلاحات اپلیکیشن Streamlit Streamlit App Correction

پاکسازی منابع Cleaning up Resources

تبریک و پاکسازی منابع AWS Congratulations and Cleaning up AWS Resources

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش Fine-Tune و استقرار مدل‌های LLM با QLoRA در Sagemaker و Streamlit

جزییات دوره

زمان دوره: 7.5 hours

تعداد ویدیو ها: 57

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 514

امتیاز مرجع: 4.6 از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Patrik Szepesi

لینک کوتاه این دوره

https://donyad.com/d/625a35

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

آموزش Fine-Tune و استقرار مدل‌های LLM با QLoRA در Sagemaker و Streamlit - آخرین آپدیت

دانلود Fine-Tune & Deploy LLMs with QLoRA on Sagemaker + Streamlit bestseller

معرفی دوره Course Overview

چه چیزی می‌سازیم What We Are Building

راه‌اندازی حساب AWS Setting up Our AWS Account

ورود به AWS Sign in to AWS

ایجاد کاربر IAM Creating IAM User

ورود با کاربر جدید AWS Signing in with new AWS User

اقدامات لازم در صورت هک شدن What to Do In case you Get Hacked

پیکربندی محیط AWS Sagemaker Setting Up AWS Sagemaker Environment

ایجاد یک Sagemaker Domain Create a Sagemaker Domain

ورود به محیط Sagemaker Logging into Our Sagemaker Environment

آشنایی با JupyterLab Introduction to JupyterLab

منابع دوره Course Resources

دسترسی به تمام منابع دوره در اینجا Access all the Course Resources Here

جمع‌آوری، تکه تکه کردن (Chunking)، توکنایز کردن و آپلود دیتاست Gathering, Chunking, Tokenizing and Uploading our Dataset

سشن‌های Sagemaker، ریجن‌ها و نقش‌های IAM Sagemaker Sessions, Regions, and IAM Roles

بررسی دیتاست از HuggingFace Examining Our Dataset from HuggingFace

توکنایزاسیون و Word Embeddings Tokenization and Word Embeddings

احراز هویت HuggingFace در Sagemaker HuggingFace Authentication with Sagemaker

اعمال تابع Templating روی دیتاست Applying the Templating Function to our Dataset

Attention Masks و Padding Attention Masks and Padding

استفاده از Star Unpacking در پایتون Star Unpacking with Python

مثال Chain Iterator، List Constructor و Attention Mask در پایتون Chain Iterator, List Constructor and Attention Mask example with Python

درک مفهوم Batching Understanding Batching

Slicing و Chunking دیتاست Slicing and Chunking our Dataset

ساخت تابع Chunking سفارشی Creating our Custom Chunking Function

توکنایز کردن دیتاست Tokenizing our Dataset

اجرای تابع Chunking Running our Chunking Function

درک کامل فرآیند Chunking Understanding the Entire Chunking Process

آپلود داده‌های آموزش به AWS S3 Uploading the Training Data to AWS S3

درک LoRA و راه‌اندازی HuggingFace Estimator Understanding LoRA and Setting up HuggingFace Estimator

تنظیم هایپرپارامترها برای عملیات آموزش Setting Up Hyperparameters for the Training Job

ایجاد HuggingFace Estimator در Sagemaker Creating our HuggingFace Estimator in Sagemaker

مقدمه‌ای بر Low rank adaptation (LoRA) Introduction to Low-rank adaptation (LoRA)

مثال عددی LoRA LoRA Numerical Example

خلاصه LoRA و محاسبه کاهش هزینه‌ها LoRA Summarization and Cost Saving Calculation

(اختیاری) مرور ضرب ماتریسی (Optional) Matrix Multiplication Refresher

درک برنامه‌نویسی LoRA بخش اول Understanding LoRA Programatically Part 1

درک برنامه‌نویسی LoRA بخش دوم Understanding LoRA Programatically Part 2

بهبود سرعت آموزش با Bfloat 16 Improving Training Speed with Bfloat 16

مقایسه Bfloat16 در برابر Float32 Bfloat16 vs Float32

مقایسه برنامه‌نویسی Bfloat16 و Float32 Comparing Bfloat16 Vs Float32 Programatically

تنظیم اسکریپت آموزش QLoRA با Mixed Precision و کوانتایزاسیون دوگانه Setting up the QLoRA Training Script with Mixed Precision & Double Quantization

تنظیم Importها و کتابخانه‌ها برای اسکریپت آموزش Setting up Imports and Libraries for the Train Script

تابع Argument Parsing بخش اول Argument Parsing Function Part 1

تابع Argument Parsing بخش دوم Argument Parsing Function Part 2

درک نکات مربوط به پارامترهای قابل آموزش Understanding Trainable Parameters Caveats

مقدمه‌ای بر کوانتایزاسیون Introduction to Quantization

شناسایی لایه‌های قابل آموزش برای LoRA Identifying Trainable Layers for LoRA

تنظیم Parameter Efficient Fine Tuning Setting up Parameter Efficient Fine Tuning

پیاده‌سازی پیکربندی LoRA و آموزش Mixed Precision Implement LoRA Configuration and Mixed Precision Training

درک کوانتایزاسیون دوگانه (Double Quantization) Understanding Double Quantization

ساخت تابع آموزش بخش اول Creating the Training Function Part 1

ساخت تابع آموزش بخش دوم Creating the Training Function Part 2

تکمیل اسکریپت Sagemaker Finishing our Sagemaker Script

دسترسی به GPUهای قدرتمند با AWS Quotas Gaining Access to Powerful GPUs with AWS Quotas

اصلاحات نهایی قبل از آموزش Final Fixes Before Training

اجرای اسکریپت Fine-Tuning برای مدل LLM Running our Fine Tuning Script for our LLM

شروع عملیات آموزش Starting our Training Job

بررسی نتایج آموزش و مانیتورینگ با Cloudwatch Inspecting the Results of our Training Job and Monitoring with Cloudwatch

استقرار مدل LLM بهینه شده Deploying our Fine Tuned LLM

استقرار LLM در Sagemaker Endpoint Deploying our LLM to a Sagemaker Endpoint

تست محلی LLM در Sagemaker Testing our LLM in Sagemaker Locally

ساخت تابع Lambda برای فراخوانی Endpoint Creating the Lambda Function to Invoke our Endpoint

ساخت API Gateway برای استقرار مدل در اینترنت Creating API Gateway to Deploy the Model Through the Internet

پیاده‌سازی اپلیکیشن Streamlit Implementing our Streamlit App

اصلاحات اپلیکیشن Streamlit Streamlit App Correction

پاکسازی منابع Cleaning up Resources

تبریک و پاکسازی منابع AWS Congratulations and Cleaning up AWS Resources

نمایش نظرات

https://donyad.com/d/625a35