لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش سریعتر مدلهای زبانی بزرگ - بررسی عمیق موازیسازی
- آخرین آپدیت
دانلود Train Large Language Models Faster - Parallelism Deep Dive
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره شامل Coursera Coach است!
روشی هوشمندتر برای یادگیری با گفتگوهای تعاملی و آنی که به شما کمک میکند دانش خود را آزمایش کنید، فرضیات را به چالش بکشید و در حین پیشروی در دوره، درک خود را عمیقتر کنید.
این دوره بر شتاببخشی به آموزش مدلهای زبانی بزرگ (LLMs) از طریق استراتژیهای موازیسازی تمرکز دارد. با بررسی تکنیکهایی مانند موازیسازی دادهها، مدل و موازیسازی ترکیبی (Hybrid)، خواهید آموخت که چگونه فرآیندهای آموزش را برای دستیابی به نتایج سریعتر بهینه کنید.
این دوره مباحث پیچیده را به صورت ساختاریافته تجزیه میکند؛ ابتدا با معرفی محاسبات موازی و قوانین مقیاسپذیری شروع شده و سپس به کاربردهای عملی با استفاده از کتابخانههای محبوبی مانند PyTorch و DeepSpeed میپردازد. شما همچنین تجربه عملی در اجرای استراتژیهای موازیسازی روی سیستمهای چند GPU و بررسی تکنیکهای تحمل خطا (Fault Tolerance) برای اطمینان از آموزش قابل اعتماد را کسب خواهید کرد. این دوره مفاهیم تئوری را با مثالهای دنیای واقعی ادغام میکند تا درکی جامع از آموزش LLM ارائه دهد.
در طول این دوره، انواع مختلف موازیسازی شامل موازیسازی دادهها، مدل، خط لوله (Pipeline) و تنسور و کاربردهای آنها در مدلهای زبانی بزرگ را بررسی خواهید کرد. شما با مجموعهدادههایی مانند MNIST و WikiText کار میکنید و تجربه عملی در پیادهسازی استراتژیهای موازی برای بهینهسازی سرعت آموزش به دست میآورید. دوره با بررسی استراتژیهای پیشرفته ذخیرهسازی (Checkpointing) و روشهای تحمل خطا به پایان میرسد تا مطمئن شوید نحوه بازیابی سیستم پس از خرابی در حین آموزش را میدانید.
این دوره برای یادگیرندگانی که علاقهمند به بهینهسازی جریانهای کاری یادگیری ماشین و تسریع توسعه مدلهای هوش مصنوعی هستند، ایدهآل است. داشتن پیشزمینه در یادگیری ماشین یا یادگیری عمیق توصیه میشود و این دوره برای یادگیرندگان سطح متوسط که به دنبال تعمیق دانش خود در استراتژیهای آموزش LLM هستند، مناسب است.
در پایان این دوره، شما قادر خواهید بود تکنیکهای مختلف موازیسازی برای آموزش LLM را پیادهسازی و مقایسه کنید، آموزش توزیعشده را در محیطهای چند GPU اجرا کنید، استراتژیهای تحمل خطا را به کار بگیرید و مباحث پیشرفته در محاسبات موازی را درک کنید.
سرفصل ها و درس ها
مقدمه
Introduction
مقدمه و هدف این دوره چیست
Introduction & What Is This Course About
ساختار دوره
Course Structure
دمو: آنچه در این دوره خواهید ساخت
DEMO - What You'll Build in This Course
استراتژیهای موازیسازی LLMها - بررسی عمیق
Strategies for Parallelizing LLMS - Deep Dive
موازیسازی چیست و چرا اهمیت دارد
What is Parallelism and Why it Matters
درک استراتژی تک GPU
Understanding the Single GPU Strategy
درک استراتژی موازی و مزایای آن
Understanding the Parallel Strategy and Advantages
موازیسازی در مقابل تک GPU - جمعبندی
Parallelism vs Single GPU - Summary
مفاهیم بنیادی IT
IT Fundamental Concepts
مبانی IT - مقدمه
IT Fundamentals - Introduction
مقدمهای بر رایانش ابری و IT سنتی
Introduction to Cloud Computing and Traditional IT
کامپیوتر چیست - بررسی اجمالی CPU و RAM
What is a Computer - CPU and RAM Overview
ذخیرهسازی دادهها و سیستمهای فایل
Data Storage and File Systems
ساختار سیستم فایل سیستمعامل
OS File System Structure
مقدمهای بر LAN
LAN Introduction
اینترنت چیست
What is the Internet
بررسی عمیق ارتباطات اینترنتی
Internet Communication Deep Dive
درک سرورها و کلاینتها
Understanding Servers and Clients
بررسی اجمالی GPUها
GPUs - Overview
معماری GPU برای آموزش LLM - بررسی عمیق
GPU Architecture for LLM Training Deep Dive
معماری GPU برای آموزش LLM
GPU Architecture for LLM Training
چرا این معماری برتر است
Why this Architecture Excels
یادگیری عمیق و یادگیری ماشین - بررسی عمیق
Deep and Machine Learning - Deep Dive
مقدمهای بر یادگیری ماشین و یادگیری عمیق
Machine and Deep Learning Introduction
یادگیری عمیق و ماشین - بررسی اجمالی و تجزیه
Deep and Machine Learning - Overview and Breakdown
جنبههای کلیدی یادگیری عمیق
Deep Learning Key Aspects
شبکههای عصبی عمیق - بررسی عمیق
Deep Neural Networks - Deep Dive
محاسبات تک نورون - بررسی عمیق
The Single Neuron Computation - Deep Dive
وزنها (Weights)
Weights
توابع فعالساز - بررسی عمیق
Activation Functions - Deep Dive
یادگیری عمیق - جمعبندی
Deep Learning - Summary
مقدمه یادگیری ماشین - ML در مقابل DL
Machine Learning Introduction - ML vs DL
انواع یادگیری و مثال مشابهت کامل ML و DL
Learning Types and Full ML & DL Analogy Example
مقایسه قابلیتهای DL و ML - جمعبندی
DL and ML Comparative Capabilities - Summary
مدلهای زبانی بزرگ - مبانی هوش مصنوعی و LLMها
Large Language Models - Fundamentals of AI and LLMs
مقدمه
Introduction
مبانی معماری ترنسفورمر (Transformer)
The Transformer Architecture Fundamentals
مکانیزم Self Attention - مثال مشابهت
The Self-Attention Mechanism - Analogy
انیمیشن معماری ترنسفورمر
The Transformer Architecture Animation
کتابخانه Transformers - بررسی عمیق
The Transformer Library - Deep Dive
مبانی محاسبات موازی و موازیسازی در آموزش LLM
Parallel Computing Fundamentals & Parallelism in LLM Training
Pytorch - بررسی اجمالی کتابخانه آموزش LLM
Pytorch - LLM Training Library Overview
بررسی اجمالی کتابخانه Transformers
The Transformers Library - Overview
بررسی اجمالی Numpy
Numpy Overview
بررسی اجمالی TorchVision و TorchDistributed
TorchVision and TorchDistributed Overview
بررسی اجمالی DeepSpeed و Megatron LM
DeepSpeed and Megatron-LM - Overview
مجموعهدادهها و دلیل استفاده از این ابزارها
Datasets and Why this Toolkit
کارگاه عملی: موازیسازی دادهها - آموزش مدل کوچک با مجموعه داده MNIST
HANDS-On: Data Parallelism - Training a Small Model - MNIST Dataset
تست مدل آموزش دیده با موازیسازی دادههای مجازی
Testing Pseudo Data Parallelism Trained Model
کارگاه عملی: موازیسازی دادهها در Colab - دمو کامل
HANDS-ON: Data Parallelism - Colab - Full Demo
موازیسازی دادهها - نکات شبیهسازی موازیسازی روی GPU
Data Parallelism - Simulated Parallelism on GPU Takeaways
کارگاه عملی: موازیسازی دادهها با مجموعه داده WikiText و بهینهسازی حافظه DeepSpeed
HANDS-ON: Data Parallelism w/ WikiText Dataset & DeepSpeed Mem. Optimization
کارگاه عملی: موازیسازی دادهها با مجموعه داده Wikitext 2
Hands-on: Data Parallelism - Wikitext-2 Dataset
DeepSpeed - بررسی کامل
DeepSpeed - Full Dive
کارگاه عملی: موازیسازی دادهها با بهینهسازی DeepSpeed
Hands-on: Data Parallelism with DeepSpeed Optimization
اجرای موازیسازی واقعی روی سیستمهای چند GPU - Runpod.io
Running TRUE Parallelism on Multiple GPU Systems - Runpod.io
بررسی اجمالی تنظیمات محیط Runpod.io
Setup Runpod.io Environment Overview
تنظیمات SSH در Runpod
Runpod SSH Setup
تنظیم موازیسازی Runpod در JupyterNotebook
Setting up Runpod Parallelism in JupyterNotebook
کارگاه عملی: موازیسازی با مجموعه داده IMDB - بررسی عمیق موازیسازی واقعی
HANDS-ON - Parallelism with IMDB Dataset - Deep Dive - True Parallelism
پاکسازی محیط Runpod
Runpod Cleanup
تحمل خطا، مقیاسپذیری و استراتژیهای پیشرفته Checkpointing - بررسی عمیق
Fault Tolerance and Scalability & Advanced Checkpointing Strategies - Deep Dive
مقدمه تحمل خطا و انواع خرابیها در آموزش توزیعشده LLM
Fault Tolerance Introduction & Types of Failures in Distributed LLM Training
استراتژیهای تحمل خطا
Strategies for Fault Tolerance
ذخیرهسازی (Checkpointing) در آموزش LLM - انیمیشن
Checkpointing in LLM Training - Animation
ذخیرهسازی پایه در آموزش LLM
Basic Checkpointing in LLM Training
ذخیرهسازی افزایشی در آموزش LLM
Incremental Checkpointing in LLM Training
ذخیرهسازی ناهمگام در آموزش LLM
Asynchronous Checkpointing in LLM Training
ذخیرهسازی چندسطحی در آموزش LLM - انیمیشن
Multi-level Checkpointing in LLM Training - Animation
ملاحظات ذخیرهسازی Checkpoint - بررسی عمیق
Checkpoint Storage Considerations - Deep Dive
پیادهسازی رویکرد ترکیبی - عملکرد، خرابی و بهینهسازیها - بررسی کامل
Implementing a Hybrid Approach - Performance, Failure, Optimizations - Full Dive
نمایش نظرات