لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش طراحی معماری دیتاسنتر هوش مصنوعی: راهنمای جامع مهندسان شبکه
- آخرین آپدیت
دانلود Architecting an AI Data Center : A Network Engineer’s Guide
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
طراحی معماری دیتاسنتر AI: مسیری به سوی AI Fabrics - ارتباطات GPU، کنترل احتقان و نسل جدید انتقال اترینت
درک سطح معماری از دیتاسنترهای هوش مصنوعی — بیاموزید که چگونه کلاسترهای GPU، شبکهها و Workloadها در کنار هم قرار میگیرند و چرا GPUها فشار شدیدی به شبکهها وارد میکنند.
درک شبکهسازی GPU و الگوهای ارتباطی — نحوه عملکرد کتابخانه ارتباطی Nvidia و تأثیر آن بر معماری شبکه را بشناسید.
دیدگاهی کاربردی در مدیریت احتقان (Congestion Management) برای AI Fabrics — بدانید چه زمانی و چرا از PFC، ECN و تکنیکهای تطبیقی استفاده کنید و تحلیل مزایا و معایب هر روش.
دانش شبکهسازی آیندهنگرانه - معرفی Ultra Ethernet نوظهور و دلیل نیاز به آن برای AI Fabric.
پیش نیازها: شما هر آنچه برای طراحی معماری یک دیتاسنتر AI نیاز دارید را خواهید آموخت. با این حال، داشتن دانش بنیادی در مفاهیم شبکهسازی و دیتاسنترها پیشفرض در نظر گرفته شده است.
بار کاری (Workloads) هوش مصنوعی مانند ترافیک دیتاسنترهای سنتی رفتار نمیکنند. دیتاسنترهای طراحی شده برای AI، پیشفرضهایی را که شبکههای سنتی بر اساس آنها ساخته شده بودند، تغییر میدهند. ارتباطات GPU-to-GPU، عملیات جمعی (Collective Operations) و ترافیک شدید East-West نیازمند رویکردی کاملاً متفاوت در طراحی شبکه است.
این دوره برای مهندسان و معماران شبکهطراحی شده است که میخواهند درک کنند بار کاری AI چگونه شبکه را تحت فشار قرار میدهد، شبکههای Front-end و Back-end چیستند و چرا از هم جدا شدهاند. شما خواهید آموخت که چگونه کتابخانههای ارتباطی GPU مانند NCCLالگوهای ترافیکی را شکل میدهند، چرا رفتار احتقان (Congestion) مهمتر از پهنای باند خام استو چه زمانی از PFC، ECN و کنترل احتقان تطبیقیبه همراه تحلیلهای دنیای واقعی استفاده کنید. این دوره همچنین DCQCN و روشهای پیشدستانه برای مقابله با احتقان شبکه را بررسی میکند.
در نهایت، این دوره با نگاهی به آینده شبکهسازی AI، معرفی کاربردی Ultra Ethernetرا ارائه میدهد و توضیح میدهد چرا اترینت سنتی باید تکامل مییافتو این برای نسل بعدی AI Fabrics چه معنایی دارد. Ultra Ethernet یک چارچوب جدید در حال توسعه است و صرفاً یک بهبود ساده برای اترینت موجود نیست.
در پایان این دوره، شما نهتنها میدانید چهتکنولوژیهایی وجود دارند، بلکه درک خواهید کرد بار کاری GPU چگونه شبکهها را تحت فشار میگذارد، چرا AI Fabrics به این شکل طراحی شدهاند و چگونه شبکههایی را معماری کنید که با مقیاس AI سازگار باشند.
سرفصل ها و درس ها
مقدمه
Introduction
مقدمه
Introduction
آنالوژی دیتاسنتر هوش مصنوعی
AI Data Center Analogy
آنالوژی در مورد علت فشار شدید GPU بر شبکهها
An Analogy on Why GPU's are so hard on Networks
سیر تکامل شبکه دیتاسنتر
Data Center Network Evolution Journey
معماری شبکه برای دیتاسنتر AI
Network Architecture for AI Data Center
تحلیل معماری شبکه Clos
Decoding Clos Network Architecture.
پاسخ به سوالات رایج درباره معماری شبکه Clos
Clos Network Architecture Some Common Queries
انواع شبکههای AI/ML و کتابخانههای ارتباطی
AI/ML Network Types and Communication Library
تفاوت نیازمندیهای شبکه در آموزش (Training) در مقابل استنتاج (Inferencing) AI/ML
AI/ML Training vs Inferencing Network Requirement
کتابخانههای ارتباطی AI/ML
AI/ML Communication Library
جلسه تحلیل روی تخته: آموزش در مقابل استنتاج
White boarding Session Training vs Inferencing
معماری شبکه AI/ML
AI/ML Network Architecture
بررسی کلی AI/ML DMA و معماری شبکه برای یک GPU
AI/ML DMA Overview and Network Architecture for One GPU
تضاد هزینه در برابر توان عملیاتی (Throughput) و معمای GPU از دید مهندس شبکه
Network Engineer Cost vs Throughput and GPU Dilemma
بررسی کلی InfiniBand و توپولوژی شبکه برای AI
Infini-band Overview and Network Topology for AI
بررسی InfiniBand و علت عقب ماندن Ethernet در انتقال دادههای متمرکز بر حافظه
Infini-band Overview and Why Ethernet Lagging in Memory Centric Transport
دنیای کپسولهسازیها (Encapsulations)
World of Encapsulations
تحلیل عمیق: دلیل اصلی توپولوژی شبکه AI/ML
Under the Hood - Big Why Behind AI/ML Network Topology
توپولوژی شبکه AI/ML: بررسی کلی طراحی شبکه مبتنی بر Rail
AI/ML Network Topology - Rail Based Network Design Overview
چالشهای رایج و دلیل استفاده از Ethernet برای AI Network Fabric
Common Challenges and Why Ethernet for AI Network Fabric
سه دلیل برای استفاده از Ethernet در AI/ML Network Fabric
3 Reasons Why Ethernet for AI/ML Network Fabric
چالشهای رایج در AI Network Fabric
Common Challenges in AI Network Fabric
مدیریت احتقان در Ethernet Network Fabric
Congestion Management In Ethernet Network Fabric
مقدمهای بر مدیریت احتقان
Congestion Management Introduction
نمایش نظرات