آموزش بوت‌کمپ NCA-AIIO - متخصص زیرساخت و عملیات هوش مصنوعی - آخرین آپدیت

دانلود NCA-AIIO - Bootcamp – AI Infra & Ops Associate

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: تسلط بر زیرساخت‌ها و عملیات هوش مصنوعی مطابق با اهداف گواهینامه‌های صنعتی با یادگیری عملی (سطح Associate). درک معماری GPU و کاربردهای آن - آشنایی با معماری پردازنده‌های گرافیکی و نقش آن‌ها در شتاب‌دهی به بارهای کاری هوش مصنوعی در صنایع مختلف. آمادگی برای آزمون گواهینامه NCA-AIIO - کسب دانش و مهارت‌های لازم برای موفقیت در آزمون Associate عملیات زیرساخت هوش مصنوعی. کار با مجموعه نرم‌افزاری GPU - یادگیری CUDA، هسته‌های GPU، سیستم‌های DGX، تکنولوژی NVLink، InfiniBand، ابزار DCGM، قابلیت GPUDirect و ابزارهای کلیدی برای مدیریت دیتاسنترهای هوش مصنوعی. درک معماری GPU و موارد استفاده - یادگیری معماری پردازنده‌های گرافیکی و تاثیر آن‌ها در سرعت بخشیدن به پردازش‌های AI در صنایع متنوع. پیش نیازها: هیچ تجربه قبلی در زمینه زیرساخت هوش مصنوعی مورد نیاز نیست؛ این دوره برای مبتدیان مناسب است. داشتن درک پایه از مفاهیم IT، دیتاسنترها یا محاسبات سازمانی مفید است اما اجباری نیست. آشنایی با سخت‌افزارهای عمومی IT و مفاهیم شبکه توصیه می‌شود.

با این دوره جامع که برای آماده‌سازی شما جهت دریافت گواهینامه Certified Associate: AI Infrastructure and Operations (NCA-AIIO) طراحی شده است، سفری تحول‌آفرین را در دنیای زیرساخت‌های هوش مصنوعی آغاز کنید. چه متخصص IT باشید، چه مدیر سیستم یا مهندس DevOps، این دوره شما را به دانش بنیادی و مهارت‌های عملی مورد نیاز برای مدیریت و بهینه‌سازی بارهای کاری AI در محیط‌های دیتاسنتر مجهز می‌کند.

آنچه در این دوره خواهید آموخت:

  • مبانی هوش مصنوعی: درک مفاهیم کلیدی هوش مصنوعی (AI)، یادگیری ماشین (ML)، یادگیری عمیق (DL) و کاربردهای آن‌ها در محاسبات مدرن.

  • سخت‌افزار و نرم‌افزار GPU: کسب تسلط بر معماری‌های GPU از جمله A100، H100 و B200، و بررسی ابزارهای نرم‌افزاری ضروری مانند CUDA، DCGM و کاتالوگ NGC.

  • طراحی زیرساخت: آشنایی با اجزای دیتاسنتر، تکنولوژی‌های شبکه مانند NVLink و InfiniBand و نحوه طراحی زیرساخت‌های مقیاس‌پذیر برای AI.

  • عملیات هوش مصنوعی (AI Ops): تسلط بر استقرار، مانیتورینگ و بهینه‌سازی بارهای کاری AI در دیتاسنترهای سازمانی با استفاده از ابزارهایی مانند DCGM، Slurm و Kubernetes.

  • آمادگی برای آزمون: آماده‌سازی کامل برای آزمون NCA-AIIO با راهنمای‌های مطالعه دقیق، سوالات تمرینی و سناریوهای واقعی. درک دقیق اهداف آزمون، یادگیری ترفندهای افزایش بازدهی و کسب اعتماد به نفس برای قبولی در اولین تلاش جهت تایید تخصص شما در عملیات زیرساخت AI.


سرفصل ها و درس ها

مقدمه Introduction

  • مقدمه Introduction

جزئیات گواهینامه Certification Details

  • جزئیات گواهینامه Certification Details

  • سرفصل‌های پوشش داده شده در گواهینامه Topics Covered in Certification

ماژول ۱: مبانی Module 1 - Fundamentals

  • محرک‌های تکامل هوش مصنوعی Drivers of AI evolution

  • موارد استفاده از AI در صنایع مختلف AI use cases across industries

  • مفاهیم AI، ML، DL و Gen AI AI, ML, DL, Gen AI

  • آنالوگی برای درک AI، ML، DL و Gen AI Analogy for AI, ML, DL, Gen AI

  • مدل ترنسفورمر (Transformer) Transformer Model

ماژول ۲: نگاهی به دیتاسنترهای متمرکز بر هوش مصنوعی Module 2 - Inside an AI centric Data Center

  • داخل یک دیتاسنتر متمرکز بر هوش مصنوعی Inside an AI centric Data Center

  • اثربخشی مصرف توان (PUE) Power Usage Effectiveness (PUE)

  • قدرت پردازشی The Compute Power

  • مقایسه CPU و GPU CPU and GPU

  • تفاوت‌های معماری CPU در مقابل GPU CPU vs. GPU - Architectural difference

  • فراتر از قانون مور Beyond Moore’s law

  • واحد پردازش داده (DPU) Data Processing Unit (DPU)

  • شبکه در دیتاسنترهای متمرکز بر AI Network inside an AI centric Data Center

  • ساختار شبکه (Network Fabric) Network fabric

  • مقایسه Ethernet و InfiniBand Ethernet vs. InfiniBand

  • اترتنت همگرا (CE) Converged Ethernet (CE)

  • ذخیره‌سازی در دیتاسنترهای متمرکز بر AI Storage inside an AI centric Data Center

  • مقایسه ابر (Cloud) در مقابل On-Prem Cloud vs. On-Prem

ماژول ۳: پشته تکنولوژی (Technology Stack) Module 3 - Technology Stack

  • تولید نوآوری در GPUهای هوش مصنوعی Powering AI GPU Innovation

  • پشته تکنولوژی Technology Stack

  • لایه ۱: لایه فیزیکی Layer 1 - Physical Layer

  • GPU در کارت گرافیک GPU on a Graphic Card

  • پلتفرم DGX DGX Platform

  • سیستم DGX SuperPOD DGX SuperPOD

  • تکنولوژی ConnectX ConnectX

  • پردازنده‌های BlueField DPU BlueField DPUs

  • معماری‌های مرجع Reference Architectures

  • درک هسته‌های GPU Understanding GPU Cores

  • مقایسه هسته‌های GPU Comparing GPU Cores

  • تاریخچه پلتفرم DGX DGX Platform - Timeline

  • گزینه‌های استقرار پلتفرم DGX DGX Platform - Deployment Options

  • مقایسه DGX A100 در مقابل H100 DGX A100 vs H100

  • لایه ۲: جابجایی داده‌ها و شتاب‌دهی I/O Layer 2: Data Movement and I/O Acceleration

  • تکنولوژی NVLink NVLink

  • تکنولوژی InfiniBand InfiniBand

  • مقایسه InfiniBand و Ethernet InfiniBand vs. Ethernet

  • مفاهیم DMA و RDMA DMA and RDMA

  • قابلیت GPUDirect RDMA GPUDirect RDMA

  • قابلیت GPUDirect Storage GPUDirect Storage

  • مقایسه سریع Quick Comparison

  • لایه ۳: سیستم‌عامل، درایور و مجازی‌سازی Layer 3: OS, Driver and Virtualization

  • درایورهای GPU GPU Drivers

  • مجازی‌سازی GPU GPU Virtualization

  • مقایسه vGPU و MIG (بخش اول) vGPU vs. MIG - Part 1

  • مقایسه vGPU و MIG (بخش دوم) vGPU vs. MIG - Part 2

  • لایه ۴: کتابخانه‌های اصلی Layer 4: Core Libraries

  • معماری CUDA Compute Unified Device Architecture (CUDA)

  • نصب CUDA Installing CUDA

  • کتابخانه ارتباطات جمعی (NCCL) Collective Communications Library (NCCL)

  • مقایسه NVLink, NVSwitch, PCIe, RDMA در مقابل NCCL NVLink, NVSwitch, PCIe, RDMA vs. NCCL

  • لایه ۵: مانیتورینگ و مدیریت Layer 5: Monitoring and Management

  • ابزار شناسایی GPU GPU Identification Utility

  • مدیر GPU دیتاسنتر (DCGM) Data Center GPU Manager (DCGM)

  • مدیر Base Command Base Command Manager

  • کدام ابزار را انتخاب کنیم؟ Which one to use?

  • لایه ۶: اپلیکیشن‌ها و راهکارهای عمودی Layer 6: Applications & Vertical Solutions

  • جمع‌بندی Summary

  • سازمان هوش مصنوعی (AI Enterprise) AI Enterprise

  • کارخانه هوش مصنوعی (AI Factory) AI Factory

ماژول ۴: گردش‌کارهای هوش مصنوعی Module 4 - AI Workflows

  • گردش‌کارهای هوش مصنوعی AI Workflows

  • فریم‌ورک‌های یادگیری ماشین (ML) ML Frameworks

  • عوامل تمایزدهنده The differentiator

  • آموزش مدل در مقابل استنتاج مدل (Training vs Inference) Model Training vs. Model Inference

  • زمان‌بندی وظایف در مقابل ارکستراسیون کانتینرها Job Scheduling vs. Container Orchestration

  • مقایسه Slurm و Kubernetes Slurm vs Kubernetes

  • یکپارچه‌سازی Integration

  • آنالوگی ML Ops ML Ops - Analogy

  • چرا ML Ops؟ Why ML Ops?

  • ابزارهای پشتیبان ML Ops Tools supporting ML Ops

نمایش نظرات

آموزش بوت‌کمپ NCA-AIIO - متخصص زیرساخت و عملیات هوش مصنوعی
جزییات دوره
4.5 hours
72
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
6,718
4.6 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Ashish Prajapati Ashish Prajapati

آموزش آسان و جذاب مهارت‌های ابری AWS