دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش هوش مصنوعی مولد: Fine-Tuning مدل‌های زبانی بزرگ (LLM) و مدل‌های Diffusion - آخرین آپدیت

دانلود Generative AI: Fine-Tuning LLMs and Diffusion Models

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: در این دوره جامع، هوش مصنوعی مولد را از طریق آموزش‌های عملی در زمینه مدل‌های زبانی بزرگ (LLMs)، تکنیک‌های PEFT (مانند LoRA و QLoRA) و مدل‌های Diffusion با استفاده از کتابخانه‌های Hugging Face، diffusers، peft، trl و bitsandbytes بیاموزید. این مسیر آموزشی شما را از درک ساختار داخلی ترنسفورمرهای Decoder-only به سمت ساخت یک مدل LLM متخصص و تولید تصاویر باکیفیت و قابل کنترل با ControlNet هدایت می‌کند. در ماژول اول، معماری‌های ترنسفورمر Decoder-only، مکانیزم Self-attention، ماسک‌گذاری علی (Causal Masking)، KV Caching و جریان توکن‌ها را بررسی می‌کنید. ماژول دوم بر روی Fine-Tuning بهینه از نظر پارامتر (PEFT) تمرکز دارد که در آن LoRA، QLoRA و کوانتیزاسیون 4-بیتی را برای آموزش مدل‌های بزرگ روی GPUهای معمولی با استفاده از خط لوله‌های SFT پیاده‌سازی خواهید کرد. ماژول سوم به مدل‌های Diffusion می‌پردازد و مفاهیمی چون فرآیندهای Forward/Reverse، UNet، زمان‌بندها (DDIM, Euler, DPM++) و شرطی‌سازی ControlNet را پوشش می‌دهد. ماژول چهارم، پروژه نهایی است که در آن یک LLM متخصص را از مرحله ایجاد دیتاست تا خروجی گرفتن از Adapter و ارزیابی آن می‌سازید. در پایان این دوره شما قادر خواهید بود: - خط لوله‌های ترنسفورمر Decoder-only را با KV caching بسازید و بهینه کنید - مدل‌های LLM با بیش از 7 میلیارد پارامتر را با استفاده از LoRA، QLoRA و SFT روی سخت‌افزارهای محدود Fine-tune کنید - خط لوله‌های diffusers را همراه با ControlNet برای تولید تصاویر کنترل‌شده پیکربندی کنید - یک Adapter مدل LLM متخصص در یک حوزه خاص را به صورت End-to-End آموزش داده، اکسپورت و ارزیابی کنید سلب مسئولیت: این یک منبع آموزشی مستقل است که توسط Board Infinity صرفاً برای مقاصد اطلاع‌رسانی و آموزشی ایجاد شده است. این دوره هیچ وابستگی رسمی به هیچ شرکت، سازمان یا مرکز صدور گواهینامه‌ای ندارد مگر اینکه صراحتاً ذکر شده باشد.

سرفصل ها و درس ها

ساختار داخلی ترنسفورمر و معماری‌های Decoder-only Transformer Internals & Decoder-Only Architectures

مهندسان LLM امروزه کجا کار می‌کنند Where LLM Engineers Work Today
چرا مدل‌های Decoder-only بر صنعت تسلط دارند (بخش اول) Why Decoder-Only Models Dominate Industry Part 1
چرا مدل‌های Decoder-only بر صنعت تسلط دارند (بخش دوم) Why Decoder-Only Models Dominate Industry part -2
مهارت‌های مورد نیاز کارفرمایان (بخش اول) Skills Employers Want
مهارت‌های مورد نیاز کارفرمایان (بخش دوم) Skills Employers Want Part 2
هنگام تایپ یک پرامپت چه اتفاقی می‌افتد What Happens When You Type a Prompt
اجزای بلوک Decoder (مدل ذهنی) Decoder Block Components (Mental Model)
نحوه جریان توکن‌ها در لایه‌ها How Tokens Flow Through Layers
ماسک‌گذاری علی و مفهوم «عدم نگاه به آینده» Causal Masking & "No Peeking"
چرا مکانیزم Attention هزینه‌بر است Why Attention Is Expensive
حافظه KV Cache: چرا استنتاج سریع‌تر می‌شود KV Cache: Why Inference Gets Faster

تکنیک‌های PEFT، LoRA، QLoRA و خط لوله‌های SFT PEFT - LoRA, QLoRA, & SFT Pipelines

ایده اصلی پشت PEFT (بخش اول) The Core Idea Behind PEFT
ایده اصلی پشت PEFT (بخش دوم) The Core Idea Behind PEFT part 2
ایده اصلی پشت PEFT (بخش سوم) The Core Idea Behind PEFT Part3
پیاده‌سازی لایه‌های LoRA در بلوک‌های Attention Implementing LoRA Layers in Attention Blocks
PEFT کجا کاربرد دارد و کجا کاربرد ندارد Where PEFT Works (and Where It Doesn't)
توضیحات جامع در مورد LoRA LoRA Explained
QLoRA: آموزش مدل‌های بزرگ روی GPUهای کوچک QLoRA: Training Big Models on Small GPUs
تنظیم هایپرپارامترهای QLoRA برای پایداری Setting QLoRA Hyperparameters for Stability
ویژگی‌های داده‌های SFT باکیفیت (بخش اول) What Good SFT Data Looks Like Part 1
ویژگی‌های داده‌های SFT باکیفیت (بخش دوم) What Good SFT Data Looks Like Part2
ساخت خط لوله‌های کامل SFT با استفاده از TRL Building Full SFT Pipelines Using TRL
ارزیابی اولیه و شناسایی سیگنال‌های شکست Early Evaluation & Failure Signals

مدل‌های Diffusion و تولید تصویر Diffusion Models & Image Generation

افزودن نویز: فرآیند Forward Adding Noise: The Forward Process
حذف نویز: فرآیند Reverse Removing Noise: The Reverse Process
چرا گام‌های زمانی (Timesteps) اهمیت دارند Why Timesteps Matter
اجزای خط لوله Diffusers (بخش اول) Diffusers Pipeline Components
اجزای خط لوله Diffusers (بخش دوم) Diffusers Pipeline Components Part2
انتخاب Scheduler مناسب Choosing the Right Scheduler
ترفندهای استایل، هدایت و نمونه‌برداری Style, Guidance & Sampling Tricks
چرا پرامپت‌نویسی به تنهایی کافی نیست Why Prompting Alone Is Not Enough
مفاهیم ControlNet (بصری) ControlNet Concepts (Visual)
تمرین عملی: شرطی‌سازی تصویر با ControlNet Practical: Conditioning an Image with ControlNet

پروژه عملی: ساخت مدل LLM متخصص The Hands-On Project - The Specialist LLM

تبدیل لاگ‌ها به داده‌های آموزشی آماده برای SFT Converting Logs Into SFT-Ready Training Data
طراحی قالب‌های پرامپت و فرمت‌های چت Designing Prompt Templates & Chat Formats
پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش اول) Cleaning, Normalizing & Validating Training Data
پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش دوم) Cleaning, Normalizing & Validating Training Data Part 2
پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش سوم) Cleaning, Normalizing & Validating Training Data Part 3
جریان کاری آموزش با استفاده از LoRA/QLoRA Training Workflow Using LoRA/QLoRA
مانیتورینگ Loss آموزش و شناسایی Overfitting Monitoring Training Loss & Detecting Overfitting
تکنیک‌های کاهش مصرف حافظه Memory-Saving Techniques
اکسپورت Adapterهای LoRA/QLoRA برای استقرار (بخش اول) Exporting LoRA/QLoRA Adapters for Deployment
اکسپورت Adapterهای LoRA/QLoRA برای استقرار (بخش دوم) Exporting LoRAQLoRA Adapters for Deployment part 2
بارگذاری Adapter در مدل‌های پایه برای استنتاج Loading the Adapter Into Base Models for Inference
ارزیابی هم‌راستایی: Perplexity، رفتار و سناریوها Evaluating Alignment: Perplexity, Behavior, Scenarios

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش هوش مصنوعی مولد: Fine-Tuning مدل‌های زبانی بزرگ (LLM) و مدل‌های Diffusion

جزییات دوره

زمان دوره: 19h 10m

تعداد ویدیو ها: 45

شرکت: Coursera (کورسرا)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 120

امتیاز مرجع: - از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Board Infinity

لینک کوتاه این دوره

https://donyad.com/d/e71276

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

آموزش هوش مصنوعی مولد: Fine-Tuning مدل‌های زبانی بزرگ (LLM) و مدل‌های Diffusion - آخرین آپدیت

دانلود Generative AI: Fine-Tuning LLMs and Diffusion Models

ساختار داخلی ترنسفورمر و معماری‌های Decoder-only Transformer Internals & Decoder-Only Architectures

مهندسان LLM امروزه کجا کار می‌کنند Where LLM Engineers Work Today

چرا مدل‌های Decoder-only بر صنعت تسلط دارند (بخش اول) Why Decoder-Only Models Dominate Industry Part 1

چرا مدل‌های Decoder-only بر صنعت تسلط دارند (بخش دوم) Why Decoder-Only Models Dominate Industry part -2

مهارت‌های مورد نیاز کارفرمایان (بخش اول) Skills Employers Want

مهارت‌های مورد نیاز کارفرمایان (بخش دوم) Skills Employers Want Part 2

هنگام تایپ یک پرامپت چه اتفاقی می‌افتد What Happens When You Type a Prompt

اجزای بلوک Decoder (مدل ذهنی) Decoder Block Components (Mental Model)

نحوه جریان توکن‌ها در لایه‌ها How Tokens Flow Through Layers

ماسک‌گذاری علی و مفهوم «عدم نگاه به آینده» Causal Masking & "No Peeking"

چرا مکانیزم Attention هزینه‌بر است Why Attention Is Expensive

حافظه KV Cache: چرا استنتاج سریع‌تر می‌شود KV Cache: Why Inference Gets Faster

تکنیک‌های PEFT، LoRA، QLoRA و خط لوله‌های SFT PEFT - LoRA, QLoRA, & SFT Pipelines

ایده اصلی پشت PEFT (بخش اول) The Core Idea Behind PEFT

ایده اصلی پشت PEFT (بخش دوم) The Core Idea Behind PEFT part 2

ایده اصلی پشت PEFT (بخش سوم) The Core Idea Behind PEFT Part3

پیاده‌سازی لایه‌های LoRA در بلوک‌های Attention Implementing LoRA Layers in Attention Blocks

PEFT کجا کاربرد دارد و کجا کاربرد ندارد Where PEFT Works (and Where It Doesn't)

توضیحات جامع در مورد LoRA LoRA Explained

QLoRA: آموزش مدل‌های بزرگ روی GPUهای کوچک QLoRA: Training Big Models on Small GPUs

تنظیم هایپرپارامترهای QLoRA برای پایداری Setting QLoRA Hyperparameters for Stability

ویژگی‌های داده‌های SFT باکیفیت (بخش اول) What Good SFT Data Looks Like Part 1

ویژگی‌های داده‌های SFT باکیفیت (بخش دوم) What Good SFT Data Looks Like Part2

ساخت خط لوله‌های کامل SFT با استفاده از TRL Building Full SFT Pipelines Using TRL

ارزیابی اولیه و شناسایی سیگنال‌های شکست Early Evaluation & Failure Signals

مدل‌های Diffusion و تولید تصویر Diffusion Models & Image Generation

افزودن نویز: فرآیند Forward Adding Noise: The Forward Process

حذف نویز: فرآیند Reverse Removing Noise: The Reverse Process

چرا گام‌های زمانی (Timesteps) اهمیت دارند Why Timesteps Matter

اجزای خط لوله Diffusers (بخش اول) Diffusers Pipeline Components

اجزای خط لوله Diffusers (بخش دوم) Diffusers Pipeline Components Part2

انتخاب Scheduler مناسب Choosing the Right Scheduler

ترفندهای استایل، هدایت و نمونه‌برداری Style, Guidance & Sampling Tricks

چرا پرامپت‌نویسی به تنهایی کافی نیست Why Prompting Alone Is Not Enough

مفاهیم ControlNet (بصری) ControlNet Concepts (Visual)

تمرین عملی: شرطی‌سازی تصویر با ControlNet Practical: Conditioning an Image with ControlNet

پروژه عملی: ساخت مدل LLM متخصص The Hands-On Project - The Specialist LLM

تبدیل لاگ‌ها به داده‌های آموزشی آماده برای SFT Converting Logs Into SFT-Ready Training Data

طراحی قالب‌های پرامپت و فرمت‌های چت Designing Prompt Templates & Chat Formats

پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش اول) Cleaning, Normalizing & Validating Training Data

پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش دوم) Cleaning, Normalizing & Validating Training Data Part 2

پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش سوم) Cleaning, Normalizing & Validating Training Data Part 3

جریان کاری آموزش با استفاده از LoRA/QLoRA Training Workflow Using LoRA/QLoRA

مانیتورینگ Loss آموزش و شناسایی Overfitting Monitoring Training Loss & Detecting Overfitting

تکنیک‌های کاهش مصرف حافظه Memory-Saving Techniques

اکسپورت Adapterهای LoRA/QLoRA برای استقرار (بخش اول) Exporting LoRA/QLoRA Adapters for Deployment

اکسپورت Adapterهای LoRA/QLoRA برای استقرار (بخش دوم) Exporting LoRAQLoRA Adapters for Deployment part 2

بارگذاری Adapter در مدل‌های پایه برای استنتاج Loading the Adapter Into Base Models for Inference

ارزیابی هم‌راستایی: Perplexity، رفتار و سناریوها Evaluating Alignment: Perplexity, Behavior, Scenarios

نمایش نظرات

https://donyad.com/d/e71276