آموزش هوش مصنوعی مولد: Fine-Tuning مدل‌های زبانی بزرگ (LLM) و مدل‌های Diffusion - آخرین آپدیت

دانلود Generative AI: Fine-Tuning LLMs and Diffusion Models

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: در این دوره جامع، هوش مصنوعی مولد را از طریق آموزش‌های عملی در زمینه مدل‌های زبانی بزرگ (LLMs)، تکنیک‌های PEFT (مانند LoRA و QLoRA) و مدل‌های Diffusion با استفاده از کتابخانه‌های Hugging Face، diffusers، peft، trl و bitsandbytes بیاموزید. این مسیر آموزشی شما را از درک ساختار داخلی ترنسفورمرهای Decoder-only به سمت ساخت یک مدل LLM متخصص و تولید تصاویر باکیفیت و قابل کنترل با ControlNet هدایت می‌کند. در ماژول اول، معماری‌های ترنسفورمر Decoder-only، مکانیزم Self-attention، ماسک‌گذاری علی (Causal Masking)، KV Caching و جریان توکن‌ها را بررسی می‌کنید. ماژول دوم بر روی Fine-Tuning بهینه از نظر پارامتر (PEFT) تمرکز دارد که در آن LoRA، QLoRA و کوانتیزاسیون 4-بیتی را برای آموزش مدل‌های بزرگ روی GPUهای معمولی با استفاده از خط لوله‌های SFT پیاده‌سازی خواهید کرد. ماژول سوم به مدل‌های Diffusion می‌پردازد و مفاهیمی چون فرآیندهای Forward/Reverse، UNet، زمان‌بندها (DDIM, Euler, DPM++) و شرطی‌سازی ControlNet را پوشش می‌دهد. ماژول چهارم، پروژه نهایی است که در آن یک LLM متخصص را از مرحله ایجاد دیتاست تا خروجی گرفتن از Adapter و ارزیابی آن می‌سازید. در پایان این دوره شما قادر خواهید بود: - خط لوله‌های ترنسفورمر Decoder-only را با KV caching بسازید و بهینه کنید - مدل‌های LLM با بیش از 7 میلیارد پارامتر را با استفاده از LoRA، QLoRA و SFT روی سخت‌افزارهای محدود Fine-tune کنید - خط لوله‌های diffusers را همراه با ControlNet برای تولید تصاویر کنترل‌شده پیکربندی کنید - یک Adapter مدل LLM متخصص در یک حوزه خاص را به صورت End-to-End آموزش داده، اکسپورت و ارزیابی کنید سلب مسئولیت: این یک منبع آموزشی مستقل است که توسط Board Infinity صرفاً برای مقاصد اطلاع‌رسانی و آموزشی ایجاد شده است. این دوره هیچ وابستگی رسمی به هیچ شرکت، سازمان یا مرکز صدور گواهینامه‌ای ندارد مگر اینکه صراحتاً ذکر شده باشد.

سرفصل ها و درس ها

ساختار داخلی ترنسفورمر و معماری‌های Decoder-only Transformer Internals & Decoder-Only Architectures

  • مهندسان LLM امروزه کجا کار می‌کنند Where LLM Engineers Work Today

  • چرا مدل‌های Decoder-only بر صنعت تسلط دارند (بخش اول) Why Decoder-Only Models Dominate Industry Part 1

  • چرا مدل‌های Decoder-only بر صنعت تسلط دارند (بخش دوم) Why Decoder-Only Models Dominate Industry part -2

  • مهارت‌های مورد نیاز کارفرمایان (بخش اول) Skills Employers Want

  • مهارت‌های مورد نیاز کارفرمایان (بخش دوم) Skills Employers Want Part 2

  • هنگام تایپ یک پرامپت چه اتفاقی می‌افتد What Happens When You Type a Prompt

  • اجزای بلوک Decoder (مدل ذهنی) Decoder Block Components (Mental Model)

  • نحوه جریان توکن‌ها در لایه‌ها How Tokens Flow Through Layers

  • ماسک‌گذاری علی و مفهوم «عدم نگاه به آینده» Causal Masking & "No Peeking"

  • چرا مکانیزم Attention هزینه‌بر است Why Attention Is Expensive

  • حافظه KV Cache: چرا استنتاج سریع‌تر می‌شود KV Cache: Why Inference Gets Faster

تکنیک‌های PEFT، LoRA، QLoRA و خط لوله‌های SFT PEFT - LoRA, QLoRA, & SFT Pipelines

  • ایده اصلی پشت PEFT (بخش اول) The Core Idea Behind PEFT

  • ایده اصلی پشت PEFT (بخش دوم) The Core Idea Behind PEFT part 2

  • ایده اصلی پشت PEFT (بخش سوم) The Core Idea Behind PEFT Part3

  • پیاده‌سازی لایه‌های LoRA در بلوک‌های Attention Implementing LoRA Layers in Attention Blocks

  • PEFT کجا کاربرد دارد و کجا کاربرد ندارد Where PEFT Works (and Where It Doesn't)

  • توضیحات جامع در مورد LoRA LoRA Explained

  • QLoRA: آموزش مدل‌های بزرگ روی GPUهای کوچک QLoRA: Training Big Models on Small GPUs

  • تنظیم هایپرپارامترهای QLoRA برای پایداری Setting QLoRA Hyperparameters for Stability

  • ویژگی‌های داده‌های SFT باکیفیت (بخش اول) What Good SFT Data Looks Like Part 1

  • ویژگی‌های داده‌های SFT باکیفیت (بخش دوم) What Good SFT Data Looks Like Part2

  • ساخت خط لوله‌های کامل SFT با استفاده از TRL Building Full SFT Pipelines Using TRL

  • ارزیابی اولیه و شناسایی سیگنال‌های شکست Early Evaluation & Failure Signals

مدل‌های Diffusion و تولید تصویر Diffusion Models & Image Generation

  • افزودن نویز: فرآیند Forward Adding Noise: The Forward Process

  • حذف نویز: فرآیند Reverse Removing Noise: The Reverse Process

  • چرا گام‌های زمانی (Timesteps) اهمیت دارند Why Timesteps Matter

  • اجزای خط لوله Diffusers (بخش اول) Diffusers Pipeline Components

  • اجزای خط لوله Diffusers (بخش دوم) Diffusers Pipeline Components Part2

  • انتخاب Scheduler مناسب Choosing the Right Scheduler

  • ترفندهای استایل، هدایت و نمونه‌برداری Style, Guidance & Sampling Tricks

  • چرا پرامپت‌نویسی به تنهایی کافی نیست Why Prompting Alone Is Not Enough

  • مفاهیم ControlNet (بصری) ControlNet Concepts (Visual)

  • تمرین عملی: شرطی‌سازی تصویر با ControlNet Practical: Conditioning an Image with ControlNet

پروژه عملی: ساخت مدل LLM متخصص The Hands-On Project - The Specialist LLM

  • تبدیل لاگ‌ها به داده‌های آموزشی آماده برای SFT Converting Logs Into SFT-Ready Training Data

  • طراحی قالب‌های پرامپت و فرمت‌های چت Designing Prompt Templates & Chat Formats

  • پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش اول) Cleaning, Normalizing & Validating Training Data

  • پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش دوم) Cleaning, Normalizing & Validating Training Data Part 2

  • پاکسازی، نرمال‌سازی و اعتبارسنجی داده‌های آموزشی (بخش سوم) Cleaning, Normalizing & Validating Training Data Part 3

  • جریان کاری آموزش با استفاده از LoRA/QLoRA Training Workflow Using LoRA/QLoRA

  • مانیتورینگ Loss آموزش و شناسایی Overfitting Monitoring Training Loss & Detecting Overfitting

  • تکنیک‌های کاهش مصرف حافظه Memory-Saving Techniques

  • اکسپورت Adapterهای LoRA/QLoRA برای استقرار (بخش اول) Exporting LoRA/QLoRA Adapters for Deployment

  • اکسپورت Adapterهای LoRA/QLoRA برای استقرار (بخش دوم) Exporting LoRAQLoRA Adapters for Deployment part 2

  • بارگذاری Adapter در مدل‌های پایه برای استنتاج Loading the Adapter Into Base Models for Inference

  • ارزیابی هم‌راستایی: Perplexity، رفتار و سناریوها Evaluating Alignment: Perplexity, Behavior, Scenarios

نمایش نظرات

آموزش هوش مصنوعی مولد: Fine-Tuning مدل‌های زبانی بزرگ (LLM) و مدل‌های Diffusion
جزییات دوره
19h 10m
45
(آخرین آپدیت)
120
- از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Board Infinity Board Infinity

Board Infinity: توانمندسازی مشاغل با مسیرهای یادگیری