لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش زیرساخت و عملیات هوش مصنوعی (NCA-AIIO)
- آخرین آپدیت
دانلود AI Infrastructure & Operations (NCA-AIIO)
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
توضیح جامع ورکلودهای هوش مصنوعی، پردازندههای گرافیکی (GPU)، مراکز داده، شبکه، ذخیرهسازی و عملیات مربوطه
تفاوت بین هوش مصنوعی (AI)، یادگیری ماشین (Machine Learning) و یادگیری عمیق (Deep Learning) با دقت سطح آزمون
درک تأثیر ورکلودهای هوش مصنوعی بر GPUها، شبکه، ذخیرهسازی و مراکز داده
مقایسه معماری CPU و GPU و تحلیل دلیل تسلط GPUها در پردازشهای هوش مصنوعی
آشنایی با پشته نرمافزاری هوش مصنوعی شامل CUDA، NGC و TensorRT
توانایی مدیریت، مانیتورینگ و تحلیل زیرساختهای هوش مصنوعی برای موفقیت در آزمون NCA-AIIO
پیشنیازها: بدون نیاز به تجربه قبلی در زمینه هوش مصنوعی، یادگیری ماشین، GPU یا مراکز داده
داشتن دانش پایه IT یا کنجکاوی فنی مفید است، اما تمامی مفاهیم از اصول اولیه توضیح داده شدهاند
هوش مصنوعی تنها بر پایه الگوریتمها اجرا نمیشود، بلکه بر پایه زیرساخت و عملیاتاستوار است. GPUها، شبکه، ذخیرهسازی، مراکز داده، پلتفرمهای ارکستریشن و انضباط عملیاتی، تعیینکنندهی موفقیت یا شکست سیستمهای هوش مصنوعی در دنیای واقعی هستند.
این دوره یک راهنمای کامل و مناسب برای مبتدیاندر مورد زیرساخت و عملیات هوش مصنوعی است که بهطور خاص برای آمادهسازی شما جهت شرکت در آزمون Certified Associate: AI Infrastructure and Operations (NCA-AIIO)طراحی شده است.
شما به هیچ تجربه قبلی در زمینه هوش مصنوعی، یادگیری ماشین، GPUها، CUDA، مراکز داده یا کوبرنتیز (Kubernetes) نیاز nدارید. هر مفهوم از اصول اولیه معرفی شده، با زبان ساده و مثالهای ملموس توضیح داده شده و سپس مستقیماً به نحوه تحلیل سوالات در آزمون متصل شده است.
ساختار این دوره دقیقاً بر اساس سه دامنه اصلی آزمون NCA-AIIO است:
زیرساخت هوش مصنوعی—مقایسه GPU در مقابل CPU، مراکز داده هوش مصنوعی، شبکه، ذخیرهسازی، مجازیسازی و معماریهای ابری و هیبریدی
عملیات هوش مصنوعی—ارکستریشن، زمانبندی (Scheduling)، مانیتورینگ، مدیریت عملکرد و بهرهبرداری از سیستمهای هوش مصنوعی در مقیاس بزرگ
به جای تمرکز بر کدنویسی یا تئوریهای علم داده، این دوره بر رفتار زیرساخت، تحلیلهای معماری و تفکر عملیاتیتأکید دارد؛ یعنی همان ذهنیتی که برای قبولی در آزمون و پشتیبانی از پلتفرمهای واقعی هوش مصنوعی مورد نیاز است.
هر بخش تلههای رایج آزمونرا برجسته کرده، اصطلاحات گیجکننده را شفاف میکند و توضیح میدهد که چرابرخی پاسخها صحیح هستند، نه اینکه فقط چهپاسخی درست است.
در پایان این دوره، شما نهتنها برای دریافت گواهینامه NCA-AIIOآماده خواهید بود، بلکه میتوانید با اطمینان توضیح دهید که سیستمهای مدرن هوش مصنوعی چگونه در محیطهای عملیاتی ساخته، مقیاسبندی و مدیریت میشوند.
سرفصل ها و درس ها
مبانی هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
AI, Machine Learning, and Deep Learning Foundations
مقدمه دوره
Course Introduction
منظور ما از هوش مصنوعی، یادگیری ماشین و یادگیری عمیق چیست؟
What Do We Mean by AI, Machine Learning, and Deep Learning?
چرا یادگیری عمیق بر هوش مصنوعی مدرن تسلط دارد؟
Why Deep Learning Dominates Modern AI
تفاوت آموزش (Training) و استنتاج (Inference)
Training vs Inference
اصطلاحات کلیدی زیرساخت AI: مدلها، مجموعهدادهها، پارامترها و Epoch
Core AI Terminology for Infrastructure: Models, Datasets, Parameters, Epoc
چرا باید درباره GPUها صحبت کنیم؟
Why We Need To Talk About GPUs
هستههای GPU، حافظه و چرا «تعداد بیشتر GPU» همیشه پاسخ نیست
GPU Cores, Memory, and Why “More GPUs” Isn’t Always the Answer
کلاسترهای GPU —از یک GPU تا تعداد زیاد
GPU Clusters — From One GPU to Many
شبکه برای کلاسترهای GPU —چرا سرعت و تأخیر (Latency) اهمیت دارند
Networking for GPU Clusters — Why Speed and Latency Matter
ذخیرهسازی برای AI —چرا سرعت داده به اندازه قدرت پردازش مهم است
Storage for AI — Why Data Speed Matters as Much as Compute
ورکلودهای هوش مصنوعی و موارد استفاده سازمانی
AI Workloads and Enterprise Use Cases
ورکلودهای رایج AI: بینایی ماشین، NLP، مدلهای زبانی بزرگ (LLM) و سیستمهای توصیه
Common AI Workloads: Computer Vision, NLP, LLMs, and Recommendation
ورکلودهای دستهای (Batch) در مقابل ورکلودهای بلادرنگ (Real-time)
Batch vs Real-Time AI Workloads
پایپلاینهای داده در سیستمهای AI —دادهها چگونه جریان مییابند
Data Pipelines in AI Systems — How Data Actually Flows
موارد استفاده سازمانی از هوش مصنوعی در صنایع مختلف
Enterprise AI Use Cases Across Industries
اکوسیستم هوش مصنوعی
The AI Ecosystem
مروری بر پشته نرمافزاری هوش مصنوعی
Overview of the AI Software Stack
توضیح CUDA برای متخصصان زیرساخت
CUDA Explained for Infrastructure Professionals
کانتینرهای NGC و فریمورکهای هوش مصنوعی
NGC Containers & AI Frameworks
TensorRT و بهینهسازی استنتاج
TensorRT & Inference Optimization
Base Command و مدیریت پلتفرم هوش مصنوعی
Base Command & AI Platform Management
زیرساخت هوش مصنوعی
AI Infrastructure
مراکز داده AI در مقابل مراکز داده سنتی
AI Data Centers vs Traditional Data Centers
سیستمهای GPU با تراکم بالا —بررسی کلی DGX
High-Density GPU Systems — DGX Overview
محدودیتهای توان، خنکسازی و فضا در مراکز داده AI
Power, Cooling, and Space Constraints in AI Data Centres
مقیاسبندی زیرساخت AI —مقایسه Scale Up و Scale Out
Scaling AI Infrastructure — Scale-Up vs Scale-Out
ترافیک شرق به غرب (East-West) در کلاسترهای AI
East-West Traffic in AI Clusters
اترتنت (Ethernet) در مقابل اینفینیبند (InfiniBand) برای AI
Ethernet vs InfiniBand for AI
مفاهیم RDMA و شبکههای با تأخیر کم
RDMA and Low-Latency Networking Concepts
گلوگاههای شبکه در آموزش مدلهای AI
Networking Bottlenecks in AI Training
نیازمندیهای ذخیرهسازی برای آموزش AI
Storage Requirements for AI Training
تفاوت نرخ انتقال داده (Throughput) و IOPS
Data Throughput vs IOPS — Understanding the Difference
آرتیفکتهای مدل و نقاط بازگشت (Checkpoints)
Model Artifacts and Checkpoints
ذخیرهسازی مستقیم GPU یا GPUDirect (مفهومی)
GPUDirect Storage (Conceptual)
مقایسه Bare Metal در مقابل GPUهای مجازی شده
Bare Metal vs Virtualized GPUs
توضیح تکنولوژی MIG
MIG Explained
چگونه یک GPU میتواند چندین ماشین مجازی را تغذیه کند (توضیح vGPU)
How One GPU Can Power Multiple Virtual Machines (vGPU Explained)
مقایسه Bare Metal، MIG و vGPU: نحوه اشتراکگذاری GPUها در زیرساخت AI
Bare Metal vs MIG vs vGPU How AI Infrastructure Shares GPUs
زیرساخت ابری در مقابل محلی (On-Prem): کدام را انتخاب کنیم؟
Cloud vs On-Prem AI Infrastructure: Which Should You Choose?
توضیح معماری هیبریدی AI: چه زمانی از ترکیب ابر و محلی استفاده کنیم؟
Hybrid AI Architecture Explained: When to Use Cloud and On-Prem Together
عملیات هوش مصنوعی
AI Operations
مدیریت کلاسترهای AI: نحوه زمانبندی GPUها و جابها
AI Cluster Management Explained: How GPUs and Jobs Are Scheduled
توضیح کوبرنتیز: نحوه استقرار و مقیاسبندی ورکلودهای AI
Kubernetes Explained: How AI Workloads Are Deployed and Scaled
مقایسه Slurm و کوبرنتیز: کدام یک ورکلودهای AI را بهتر اجرا میکند؟
Slurm vs Kubernetes: Which One Runs Al Workloads Better?
چگونه کلاسترهای AI تصمیم میگیرند چه کسی به GPU دسترسی داشته باشد
How AI Clusters Decide Who Gets the GPU
چگونه بفهمیم GPUهای ما بلااستفاده ماندهاند
How to Tell If Your GPUs Are Being Wasted
مصرف پایین GPU؟ احتمالاً مشکل از GPU نیست (دلایل)
Low GPU Usage? It’s Probably Not the GPU (Here’s Why)
کدام متریک AI مهمتر است؟ (Throughput در مقابل GPU Utilisation)
Which AI Metric Matters? (Throughput vs GPU utilisation)
بهرهبرداری از سیستمهای هوش مصنوعی در مقیاس بزرگ
Operating AI Systems at Scale
چرا مدیریت سیستمهای AI سختتر از آن چیزی است که فکر میکنید
Why Running AI Systems is Harder Than You Think
چگونه ظرفیت زیرساخت AI را برنامهریزی کنیم (بدون اتلاف هزینه)
How to Plan AI Infrastructure Capacity (Without Wasting Money)
هنگام شکست سیستمهای AI چه اتفاقی میافتد؟ (توضیح Reliability و Failover)
What Happens When AI Systems Fail? (Reliability & Failover Explained
نمایش نظرات