آموزش تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و هوش مصنوعی مولد (Gen-CV) - آخرین آپدیت

دانلود Mastering Computer Vision: From Pixel to Detection to Gen-CV

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: تسلط بر CNNs، ResNet، Inception، YOLO، SSD، U-Net، Mask R-CNN، GANs، ViT، SAM و VAE با استفاده از پایتون، OpenCV و پروژه‌های PyTorch تسلط بر مبانی بینایی ماشین: درک نحوه پردازش و تفسیر داده‌های بصری توسط کامپیوتر، از دستکاری پیکسل‌ها و فضاهای رنگی تا فیلترینگ پیشرفته ساخت و استقرار مدل‌های یادگیری عمیق: طراحی، آموزش و بهینه‌سازی شبکه‌های عصبی پیچشی (CNNs) با استفاده از TensorFlow و PyTorch، شامل معماری‌های پیشرفته پیاده‌سازی سیستم‌های پیشرفته تشخیص اشیاء: توسعه اپلیکیشن‌های تشخیص اشیاء آماده برای محیط تولید با استفاده از YOLO، Faster R-CNN و DETR ایجاد مدل‌های پیشرفته بخش‌بندی (Segmentation) و مولد: ساخت سیستم‌های بخش‌بندی معنایی و نمونه با استفاده از U-Net و Mask R-CNN و ایجاد کاربردهای هوش مصنوعی مولد به‌کارگیری تکنیک‌های یادگیری انتقالی (Transfer Learning) و تنظیم دقیق (Fine-Tuning): بهره‌گیری از مدل‌های پیش‌آموزش‌دیده روی ImageNet برای حل مسائل سفارشی بینایی ماشین توسعه یک پورتفولیوی حرفه‌ای: تکمیل بیش از ۷ پروژه صنعتی شامل طبقه‌بندی تصاویر، تشخیص اشیاء در زمان واقعی، ابزارهای حذف پس‌زمینه و غیره درک تئوری یادگیری عمیق و ریاضیات: تسلط بر مبانی ریاضی شبکه‌های عصبی از جمله پس‌انتشار (Backpropagation)، گرادیان نزولی و توابع زیان تسلط بر ابزارها و فریم‌ورک‌های استاندارد صنعت: کسب مهارت در TensorFlow، PyTorch، OpenCV، scikit-image و متدهای مدرن MLOps برای استقرار مدل آمادگی برای مصاحبه‌های مهندسی بینایی ماشین: توانایی تحلیل و توضیح معماری‌هایی مانند اتصالات باقی‌مانده در ResNet و تشخیص تک-شات در YOLO استقرار مدل‌ها در محیط عملیاتی: یادگیری بهترین روش‌ها برای بهینه‌سازی مدل، کوانتایزیشن، خط لوله‌های استقرار و ارائه مدل‌های بینایی ماشین در دنیای واقعی پیش نیازها: برای بهره‌برداری حداکثری از این دوره، باید تسلط مناسبی بر برنامه‌نویسی پایه پایتون (متغیرها، حلقه‌ها، توابع و شرط‌ها) داشته باشید و با Jupyter Notebook یا IDEهای پایتون آشنا باشید. درک مفاهیم پایه ریاضیات (جبر و حساب دیفرانسیل) مفید است اما الزامی نیست. از نظر سخت‌افزاری، به سیستمی با حداقل ۸ گیگابایت رم نیاز دارید. هیچ تجربه قبلی در یادگیری ماشین یا بینایی ماشین نیاز نیست، زیرا ما از صفر شروع می‌کنیم؛ تنها چیزی که نیاز دارید اشتیاق به یادگیری و کدنویسی است.

تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و Gen-CV

در ۳۴ ساعت از یک یادگیرنده مشتاق به یک مهندس متخصص بینایی ماشین تبدیل شوید

آیا آماده‌اید تکنولوژی‌هایی را بسازید که دنیای بصری ما را شکل می‌دهند؟

بینایی ماشین فقط آینده نیست، بلکه همین حالاست. ماشین‌های خودران در خیابان‌ها حرکت می‌کنند، اپلیکیشن‌ها چهره شما را می‌شناسند و هوش مصنوعی آثار هنری خیره‌کننده خلق می‌کند. پشت هر نوآوری بصری، تکنولوژی بینایی ماشین قرار دارد و تقاضا برای مهندسان ماهر CV هرگز به این اندازه بالا نبوده است. شرکت‌هایی مانند گوگل، تسلا و متا به دنبال متخصصانی هستند که بتوانند سیستم‌های بینایی را بسازند و بهینه کنند.

اما چالش اینجاست: اکثر دوره‌ها یا شما را در تئوری‌های خشک غرق می‌کنند یا بدون ایجاد درک بنیادی، شما را به سراغ فریم‌ورک‌های یادگیری عمیق می‌برند.

این دوره متفاوت است.

دوره «تسلط بر بینایی ماشین» یک مسیر کامل را ارائه می‌دهد؛ از درک نحوه پردازش تک‌تک پیکسل‌ها تا استقرار پیشرفته‌ترین مدل‌های هوش مصنوعی مولد. چه دانشجویی باشید که می‌خواهد متمایز شود، چه متخصصی که قصد تغییر شغل دارد و چه کارآفرینی که در حال ساخت محصولی مبتنی بر بینایی است، این مسیر جامع شما را از صفر به سطح آماده برای استقرار می‌رساند.

چه چیزی این دوره را منحصر به فرد می‌کند؟

معماری یادگیری پیشرونده: ما هیچ مرحله‌ای را نمی‌پرشیم. شما با پردازش کلاسیک تصاویر و مبانی OpenCV شروع می‌کنید تا درک کنید کامپیوتر واقعاً چگونه «می‌بیند». سپس شبکه‌های عصبی پیچشی را فرا می‌گیرید و در نهایت به سراغ معماری‌های لبه تکنولوژی مانند Vision Transformers، DETR و SAM می‌روید.

۳۴ ساعت تمرین عملی: هر مفهوم با کد نمایش داده می‌شود. هر ماژول شامل پروژه‌های کاربردی است. شما فقط ویدیو نمی‌بینید، بلکه اپلیکیشن‌های واقعی را با TensorFlow و PyTorch می‌سازید.

بیش از ۷ پروژه آماده برای پورتفولیو: در پایان دوره، شما یک CNN برای طبقه‌بندی مد با دقت بالای ۹۲٪، یک تشخیص‌دهنده اشیاء YOLO با سرعت ۴۵+ FPS، سیستم حذف پس‌زمینه مبتنی بر U-Net، اپلیکیشن انتقال استایل تصویر، سیستم تشخیص چهره با نقاط کلیدی، ابزار بخش‌بندی Mask R-CNN و مدل‌های سفارشی را ساخته‌اید.

آمادگی برای مصاحبه‌های شغلی: شما با اعتماد به نفس درباره اتصالات ResNet، نوآوری‌های YOLO، اتصالات Skip در U-Net و مکانیسم‌های توجه در Vision Transformers صحبت خواهید کرد. هر معماری با وضوح کامل توضیح داده شده تا بتوانید «چرا»ی هر روش را در مصاحبه‌های فنی توضیح دهید.

این دوره برای چه کسانی است؟

این دوره برای دانشجویان جویای مهارت‌های تخصصی AI، توسعه‌دهندگان نرم‌افزاری که می‌خواهند بینایی ماشین را به ابزارهای خود اضافه کنند، افرادی که قصد تغییر شغل به مهندسی AI را دارند، پژوهشگران نیازمند مهارت‌های پیاده‌سازی عملی و کارآفرینان حوزه محصولات بصری طراحی شده است.

پیش‌نیازها: دانش پایه برنامه‌نویسی پایتون. بقیه موارد را از پایه آموزش می‌دهیم.

مرور کلی سرفصل‌ها

ماژول ۱: مبانی (پردازش تصویر و OpenCV): تسلط بر مفاهیم پایه: نمایش پیکسل، فضاهای رنگی (RGB, HSV, Grayscale)، تبدیلات هندسی و فیلترینگ با کرنل‌های کانولوشن.

ماژول ۲: یادگیری عمیق و CNNها: درک شبکه‌های عصبی از اصول اولیه: نورون‌ها، توابع فعال‌ساز، پس‌انتشار و گرادیان نزولی. سپس درک دلیل برتری CNNها در بینایی ماشین.

ماژول ۳: معماری‌های پیشرفته CNN: بررسی نوآوری‌های برنده ImageNet: عمق VGG، یادگیری باقی‌مانده در ResNet، پردازش چند مقیاسی Inception و مقیاس‌بندی EfficientNet. تسلط بر یادگیری انتقالی برای تطبیق مدل‌های پیش‌آموزش‌دیده با تسک‌های سفارشی.

ماژول ۴: تشخیص اشیاء (Object Detection): ساخت سیستم‌هایی برای شناسایی و مکان‌یابی چندین شیء. بررسی تشخیص‌دهنده‌های دو مرحله‌ای (خانواده R-CNN) و تک مرحله‌ای (YOLO, SSD) برای عملکرد در زمان واقعی و معماری مدرن DETR.

ماژول ۵: بخش‌بندی تصویر (Image Segmentation): طبقه‌بندی در سطح پیکسل برای ایجاد ماسک‌های دقیق. تسلط بر بخش‌بندی معنایی با U-Net و بخش‌بندی نمونه با Mask R-CNN و بررسی مدل‌های پایه مانند SAM.

ماژول ۶: مدل‌های مولد و ترنسفورمرهای بینایی: ورود به مرزهای هوش مصنوعی بصری. درک VAEها، ساخت GANها برای تولید تصاویر واقع‌گرایانه و تسلط بر Vision Transformers (ViT) و مکانیسم‌های توجه جهانی.

در پایان این دوره شما قادر خواهید بود:

بینایی ماشین را از اصول اولیه تا مدل‌های پیشرفته درک کنید (نه فقط استفاده از کتابخانه، بلکه ریاضیات و شهود پشت هر تکنیک).

اپلیکیشن‌های آماده تولید برای تشخیص اشیاء، بخش‌بندی تصاویر و تولید محتوای بصری با عملکرد عالی بسازید.

در مصاحبه‌های فنی شرکت‌های بزرگی مانند گوگل و تسلا با اعتماد به نفس درباره معماری‌های ResNet، YOLO، U-Net و ViT بحث کنید.

سیستم‌های دنیای واقعی را با استفاده از TensorFlow، PyTorch و متدهای MLOps مستقر کنید.

پورتفولیویی شامل بیش از ۷ پروژه صنعتی داشته باشید که تخصص شما را در کل خط لوله بینایی ماشین نشان دهد.

با زبان فنی مهندسان CV صحبت کنید و توازن بین دقت و سرعت، و پیچیدگی مدل و نیازهای استقرار را درک کنید.

تحول شما از همین حالا شروع می‌شود

از دستکاری پیکسل تا هوش مصنوعی مولد؛ شما کل مسیر را فرا می‌گیرید. انقلاب بصری در حال رخ دادن است. سوال این است: آیا شما سازنده آن خواهید بود یا فقط تماشا می‌کنید؟

همین امروز ثبت‌نام کنید و از یک یادگیرنده مشتاق به یک مهندس متخصص بینایی ماشین تبدیل شوید.

این دوره شامل ۳۴ ساعت محتوای ویدئویی، دموهای کدنویسی عملی، بیش از ۷ پروژه کامل، دسترسی مادام‌العمر، گواهینامه پایان دوره و ضمانت بازگشت وجه ۳۰ روزه است.

به دانشجویانی بپیوندید که مسیر شغلی خود را با این مسترکلاس جامع تغییر داده‌اند. سفر شما از مبتدی تا متخصص CV از اینجا شروع می‌شود.


سرفصل ها و درس ها

مقدمه Introduction

  • ماژول ۱ مبانی بینایی ماشین و پردازش تصویر Module 1 - Foundations of CV & Image Processing

  • ۱.۱ مقدمه‌ای بر بینایی ماشین اهداف یادگیری 1.1 Introduction to Computer Vision - Learning Objectives

  • ۱.۱.۱ ۱ مقدمه بینایی ماشین 1.1.1-1 Introduction to Computer Vision

  • ۱.۱.۱ ۲ بینایی ماشین چیست؟ 1.1.1-2 What is Computer Vision ?

  • ۱.۱.۱ ۳ شکاف معنایی چالش اصلی بینایی ماشین 1.1.1-3 The Semantic Gap The Core Challenge of CV

  • توضیح مثال کد ۱.۱.۱ Code Eg 1.1.1 Explaination

  • ۱.۱.۲ ۱ تکامل بینایی ماشین 1.1.2-1 The Evolution of Computer Vision

  • ۱.۱.۲ ۲ تشخیص لبه سوبل (Sobel) 1.1.2-2 Sobel Edge Detection

  • ۱.۱.۲ ۳ تشخیص لبه کنی (Canny) 1.1.2-3 Cannny Edge detection

  • توضیح مثال کد ۱.۱.۲ Code Eg 1.1.2 Explaination

  • ۱.۱.۳ ۱ استخراج ویژگی‌های HoG 1.1.3-1 Extracting HoG Features

  • ۱.۱.۳ ۲ تشخیص ویژگی‌های SIFT 1.1.3-2 Detect SIFT Features

  • توضیح مثال کد ۱.۱.۳ Code Eg 1.1.3 Explaination

  • ۱.۱.۴ ۱ طبقه‌بندی‌کننده‌های ML روی ویژگی‌های آموخته شده 1.1.4-1 ML Classifiers on learned Features

  • ۱.۱.۴ ۲ آموزش ماشین‌های بردار پشتیبان (SVM) 1.1.4-2 Train Support Vector Machines (SVM)

  • ۱.۱.۴ ۳ آموزش k-نزدیک‌ترین همسایه (KNN) 1.1.4-3 Train k-Nearest neighbour ( KNN )

  • توضیح مثال کد ۱.۱.۴ Code Eg 1.1.4 Explaination

  • ۱.۱.۵ ۱ عصر دوم عصر یادگیری عمیق 1.1.5-1 Era 2 - The Deep Learning Era

  • ۱.۱.۵ ۲ عصر هوش مصنوعی مولد 1.1.5-2 The Generative AI Era

  • ۱.۱.۵ ۳ گردش کار جهانی بینایی ماشین 1.1.5-3 The Universal Computer Vision Workflow

  • توضیح تمرین کد ۱.۱ Code Exercise 1.1 Explaination

  • ۱.۲ مبانی تصویر دیجیتال اهداف یادگیری 1.2 Digital Image Fundamentals - Learning Objectives

  • ۱.۲.۱ ۱ مبانی تصویر دیجیتال 1.2.1-1 Digital Image Fundamentals

  • ۱.۲.۱ ۲ پیکسل اتم بینایی 1.2.1-2 Pixel The Atom of Vision

  • ۱.۲.۱ ۳ تصویر به عنوان ماتریس واقعیت ریاضی 1.2.1-3 Image as Matrix - The Maths Reality

  • ۱.۲.۱ ۴ تصاویر رنگی به عنوان ماتریس‌های سه بعدی 1.2.1-4 Color Images as 3D Matrices

  • توضیح مثال کد ۱.۲.۱ Code Eg 1.2.1 Explaination

  • ۱.۲.۲ ۱ فضاهای رنگی RGB روش افزودنی 1.2.2-1 Color Spaces RGB The Additive

  • ۱.۲.۲ ۲ فضاهای رنگی HSV تشخیص مقاوم 1.2.2-2 Color Spaces HSV Robust Detection

  • ۱.۲.۲ ۳ فضاهای رنگی Grayscale (سیاه و سفید) 1.2.2-3 Color Spaces Grayscale

  • توضیح مثال کد ۱.۲.۲ Code Eg 1.2.2 Explaination

  • ۱.۲.۳ عمق تصویر (Bit Depth) 1.2.3 Image Depth (Bit Depth)

  • توضیح مثال کد ۱.۲.۳ Code Eg 1.2.3 Explaination

  • ۱.۲.۴ کار عملی بینایی ماشین با OpenCV 1.2.4 Hands-On CV with OpenCV

  • توضیح مثال کد ۱.۲.۴ Code Eg 1.2.4 Explaination

  • توضیح تمرین کد ۱.۲ Code Exercise 1.2 Explaination

  • ۱.۳ تکنیک‌های ضروری پیش‌پردازش تصویر اهداف یادگیری 1.3 Essential Image Preprocessing Techniques - Learning Objectives

  • ۱.۳.۱ ۱ پیش‌پردازش تصویر 1.3.1-1 Image Preprocessing

  • ۱.۳.۱ ۲ تبدیل تصویر 1.3.1-2 Image Transformation

  • توضیح مثال کد ۱.۳.۱ Code Eg. 1.3.1 Explaination

  • ۱.۳.۲ ۱ تبدیلات هندسی 1.3.2-1 Geometric Transformations

  • ۱.۳.۲ ۲ تبدیل هندسی ۱ مقیاس‌بندی (Scaling) 1.3.2-2 Geometric Transform 1 - Scaling

  • ۱.۳.۲ ۳ تبدیل هندسی ۲ چرخش و انتقال 1.3.2-3 Geometric Transform 2 - Rotation & Translation

  • ۱.۳.۲ ۴ کار عملی با تبدیلات هندسی OpenCV 1.3.2-4 Hands-On OpenCV Geometric Transformations

  • توضیح مثال کد ۱.۳.۲ Code Eg. 1.3.2 Explaination

  • ۱.۳.۳ تبدیل هندسی ۳ آفین در مقابل پرسپکتیو 1.3.3 Geometric Transform 3 - Affine vs. Perspective

  • توضیح مثال کد ۱.۳.۳ Code Eg. 1.3.3 Explaination

  • ۱.۳.۴ ۱ ریاضیات تبدیلات هندسی 1.3.4-1 The Math of Geometric Transformations

  • ۱.۳.۴ ۲ تنظیمات فوتومتریک اصلاح نور و کنتراست 1.3.4-2 Photometric Adjustments Fixing Light & Contrast

  • ۱.۳.۴ ۳ تنظیم فوتومتریک یکسان‌سازی هیستوگرام 1.3.4-3 Photometric Adjustment Histogram Equalization

  • توضیح مثال کد ۱.۳.۴ Code Eg. 1.3.4 Explaination

  • ۱.۳.۵ ۱ فیلترینگ جادوی کانولوشن 1.3.5-1 Filtering The Magic of Convolution

  • ۱.۳.۵ ۲ کرنل‌ها فیلترهای دست‌ساز برای بینایی 1.3.5-2 The Kernels - Handcrafted Filters for Vision

  • توضیح مثال کد ۱.۳.۵ Code Eg. 1.3.5 Explaination

  • ۱.۳.۶ کاربردی پیش‌پردازش برای تشخیص چهره 1.3.6 Practical - Preprocessing for Face Recognition

  • توضیح مثال کد ۱.۳.۶ Code Eg. 1.3.6 Explaination

  • توضیح تمرین کد ۱.۳ Code Exercise 1.3 Explaination

ماژول ۲: مبانی یادگیری عمیق و شبکه‌های عصبی پیچشی (CNNs) Module 2: Deep Learning Foundations & Convolutional Neural Networks (CNNs)

  • ماژول ۲ مبانی یادگیری عمیق و شبکه‌های عصبی پیچشی (CNN) مقدمه Module 2 Deep Learning Foundations & Convolutional Neural Networks (CNN) - Intro

  • ۲.۱ از پرسپترون‌ها تا شبکه‌های عصبی عمیق اهداف یادگیری 2.1 From Perceptrons to Deep Neural Networks - Learning Objectives

  • ۲.۱.۱ ۱ تاریخچه بینایی ماشین ۱۹۵۰ تا ۱۹۹۰ 2.1.1-1 Computer Vision History 1950-1990s

  • ۲.۱.۱ ۲ عصر مدرن بینایی ماشین ۱۹۹۰ تا کنون 2.1.1-2 Computer Vision Modern Era 1990s - Present

  • توضیح مثال کد ۲.۱.۱ Code Eg. 2.1.1 Explaination

  • ۲.۱.۲ ۱ لایه ورودی تا اولین لایه پنهان ریاضیات کامل 2.1.2-1 Input Layer to first hidden layer Complete Maths

  • ۲.۱.۲ ۲ تابع فعال‌ساز 2.1.2-2 Activation Function

  • ۲.۱.۲ ۳ لایه پنهان دوم شبکه عصبی 2.1.2-3 Hidden Layer 2 of Neural Network

  • ۲.۱.۲ ۴ نورون لایه خروجی ریاضیات کامل 2.1.2-4 Output Layer Neuron Complete Maths

  • ۲.۱.۲ ۵ انواع لایه‌ها و نقش آن‌ها 2.1.2-5 Layer Types and Their Roles

  • توضیح مثال کد ۲.۱.۲ Code Eg. 2.1.2 Explaination

  • ۲.۱.۳ ۱ فرآیند یادگیری دو مرحله‌ای گذر پیشرو (Forward Pass) 2.1.3-1 The two step Learninng Process Forward Pass

  • ۲.۱.۳ ۲ زیان انتروپی متقاطع طبقه‌بندی باینری 2.1.3-2 Cross-Entropy Loss Binary Classification

  • ۲.۱.۳ ۳ زیان انتروپی متقاطع طبقه‌بندی چندکلاسه 2.1.3-3 Cross-Entropy Loss Multi-Class Classification

  • ۲.۱.۳ ۴ گذر پس‌رو (Backward Pass) یادگیری از اشتباهات 2.1.3-4 Backward Pass - Learning from mistakes

  • ۲.۱.۳ ۵ گرادیان نزولی 2.1.3-5 Gradient Descent

  • توضیح مثال کد ۲.۱.۳ Code Eg. 2.1.3 Explaination

  • ۲.۱.۴ ۱ خلاصه فرآیند یادگیری دو مرحله‌ای 2.1.4-1 The two step Learninng Process - Summary

  • ۲.۱.۴ ۲ هایپرپارامتر نرخ یادگیری و نقش بهینه‌ساز 2.1.4-2 The Learning Rate Hyperparameter & Role of Optimizer

  • توضیح مثال کد ۲.۱.۴ Code Eg. 2.1.4 Explaination

  • توضیح تمرین کد ۲.۱ Code Exercise 2.1 Explaination

  • ۲.۲ معماری CNN اهداف یادگیری 2.2 The CNN Architecture - Learning Objectives

  • ۲.۲.۱ چرا شبکه‌های DNN در تسک‌های بینایی ماشین شکست می‌خورند 2.2.1 Why DNNs fail at Computer Vision Tasks

  • توضیح مثال کد ۲.۲.۱ Code Eg. 2.2.1 Explaination

  • ۲.۲.۲ ۱ درک شبکه‌های عصبی پیچشی (CNNs) 2.2.2-1 Understanding Convolutional Neural Networks (CNNs)

  • ۲.۲.۲ ۲ عملیات کانولوشن و فرآیند پنجره لغزان 2.2.2-2 Convolution Operation & Sliding Window Process

  • ۲.۲.۲ ۳ انواع فیلترهای کانولوشن 2.2.2-3 Types of convolution filters

  • ۲.۲.۲ ۴ استرایدها (Strides) و پدینگ (Padding) 2.2.2-4 Strides & Padding

  • توضیح مثال کد ۲.۲.۲ Code Eg. 2.2.2 Explaination

  • ۲.۲.۳ ۱ فعال‌ساز ReLU و MaxPooling 2.2.3-1 ReLU Activation & MaxPooling

  • ۲.۲.۳ ۲ فعال‌ساز ReLU درک مفهومی 2.2.3-2 ReLU Activation – Conceptual Understanding

  • ۲.۲.۳ ۳ پولینگ درک مفهومی 2.2.3-3 Pooling – Conceptual Understanding

  • توضیح مثال کد ۲.۲.۳ Code Eg. 2.2.3 Explaination

  • ۲.۲.۴ ۱ مثال CNN دو لایه 2.2.4-1 Two Layered CNN example

  • ۲.۲.۴ ۲ لایه متراکم (Dense) یا کاملاً متصل و لایه خروجی 2.2.4-2 Dense or Fully Connected Layer & Output Layer

  • ۲.۲.۴ ۳ اتصال محلی CNN و اشتراک وزن‌ها 2.2.4-3 CNN Local Connectivity & Weight Sharing

  • ۲.۲.۴ ۴ ناوردایی انتقال و ساخت ویژگی‌های سلسله‌مراتبی 2.2.4-4 Translation Invariance & Hierarchical Feature Building

  • توضیح مثال کد ۲.۲.۴ Code Eg. 2.2.4 Explaination

  • توضیح تمرین کد ۲.۲ Code Exercise 2.2 Explaination

  • ۲.۳ ساخت اولین CNN شما اهداف یادگیری 2.3 Building Your First CNN - Learning Objectives

  • ۲.۳.۱ ۱ هدف عملی آموزش یک CNN برای دیدن 2.3.1-1 Hands-On Goal Train a CNN to See!

  • ۲.۳.۱ ۲ داده‌ها مهم‌ترین جزء 2.3.1-2 Data The Most Important Ingredient

  • ۲.۳.۱ ۳ تنسورها به عنوان ورودی داده و GPU به عنوان شتاب‌دهنده 2.3.1-3 Tensors as Data Input, & GPU as accelerator

  • ۲.۳.۱ ۴ مزایای PyTorch 2.3.1-4 The PyTorch Advantage

  • توضیح مثال کد ۲.۳.۱ Code Eg. 2.3.1 Explaination

  • ۲.۳.۲ ۱ معماری CNN اولین مدل ما 2.3.2-1 CNN Architecture Our First Model

  • ۲.۳.۲ ۲ معماری CNN خروجی لایه به لایه 2.3.2-2 CNN Architecture Layer wise Output

  • توضیح مثال کد ۲.۳.۲ Code Eg. 2.3.2 Explaination

  • ۲.۳.۳ ۱ گذر پیشرو، پس‌انتشار و ارزیابی 2.3.3-1 Forward Pass, Backpropagation, and Evaluation

  • ۲.۳.۳ ۲ تثلیث آموزش 2.3.3-2 The Training Triad

  • ۲.۳.۳ ۳ استراتژی‌های آموزش موثر و تشخیص‌ها 2.3.3-3 Effective Training Strategies and Diagnostics

  • ۲.۳.۳ ۴ حلقه آموزش جایی که یادگیری واقعی رخ می‌دهد 2.3.3-4 The Training Loop Where Learning Actually Happens

  • ۲.۳.۳ ۵ مشکلات رایج و راهکارها 2.3.3-5 Common Issues and Solutions

  • توضیح مثال کد ۲.۳.۳ Code Eg. 2.3.3 Explaination

  • ۲.۳.۴ ۱ فراتر از آموزش مدل ما چقدر خوب است 2.3.4-1 Beyond Training How Good Is Our Model

  • ۲.۳.۴ ۲ چک‌لیست آموزش CNN 2.3.4-2 CNN Training The Checklist

  • توضیح مثال کد ۲.۳.۴ Code Eg. 2.3.4 Explaination

  • توضیح تمرین کد ۲.۳ Code Exercise 2.3 Explaination

ماژول ۳: معماری‌های پیشرفته CNN و یادگیری انتقالی Module 3: Advanced CNN Architectures and Transfer Learning

  • ماژول ۳: معماری‌های پیشرفته CNN و یادگیری انتقالی مقدمه Module 3: Advanced CNN Architectures and Transfer Learning - Introduction

  • ۳.۱ معماری‌های شاخص CNN اهداف سخنرانی 3.1 Landmark CNN Architectures - Lecture Objectives

  • ۳.۱.۱ ۱ معماری‌های CNN مدل LeNet 5 (۱۹۹۸) 3.1.1-1 CNN Architectures LeNet-5 (1998)

  • ۳.۱.۱ ۲ تکامل معماری‌های شاخص CNN 3.1.1-2 Evolution of Landmark CNN Architectures

  • ۳.۱.۱ ۳ مدل AlexNet (۲۰۱۲) 3.1.1-3 AlexNet (2012)

  • توضیح مثال کد ۳.۱.۱ Code Eg 3.1.1 Explaination

  • ۳.۱.۲ ۱ مدل VGGNet (۲۰۱۴) 3.1.2-1 VGGNet (2014)

  • ۳.۱.۲ ۲ مدل ResNet (۲۰۱۵) 3.1.2-2 ResNet (2015)

  • توضیح مثال کد ۳.۱.۲ Code Eg 3.1.2 Explaination

  • ۳.۱.۳ ۱ مدل Inception (GoogLeNet) ۲۰۱۴ 3.1.3-1 Inception (GoogLeNet) - 2014

  • ۳.۱.۳ ۲ مدل DenseNet ۲۰۱۷ 3.1.3-2 DenseNet - 2017

  • ۳.۱.۳ ۳ مدل EfficientNet (۲۰۱۹) 3.1.3-3 EfficientNet (2019)

  • ۳.۱.۳ ۴ چگونه معماری CNN مناسب (Backbone) را انتخاب کنیم 3.1.3-4 How to choose suitable CNN architecture ( Backbone )

  • ۳.۲ یادگیری انتقالی و تنظیم دقیق اهداف یادگیری 3.2 Transfer Learning and Fine-Tuning - Learning Objectives

  • ۳.۲.۱ ۱ دو رویکرد یادگیری انتقالی و تنظیم دقیق 3.2.1-1 Two Approaches Transfer Learning & Fine-Tuning

  • ۳.۲.۱ ۲ انگیزه چرا از مدل‌های پیش‌آموزش‌دیده استفاده کنیم 3.2.1-2 The Motivation Why Reuse Pre-Trained Models

  • ۳.۲.۱ ۳ استخراج ویژگی انتخاب امن 3.2.1-3 Feature Extraction The Safe Bet

  • ۳.۲.۱ ۴ مکانیسم نحوه پیاده‌سازی استخراج ویژگی 3.2.1-4 Mechanics How to Implement Feature Extraction

  • توضیح مثال کد ۳.۲.۱ Code Eg 3.2.1 Explaination

  • ۳.۲.۲ ۱ تنظیم دقیق (Fine Tuning) انتخاب با کارایی بالا 3.2.2-1 Fine-Tuning The High Performance Bet

  • ۳.۲.۲ ۲ گام جریان گرادیان 3.2.2-2 The Gradient Flow Step

  • ۳.۲.۲ ۳ نرخ‌های یادگیری تفکیکی کلید آموزش موفق 3.2.2-3 Differential Learning Rates Key to Successful Training

  • ۳.۲.۲ ۴ تثبیت وزن‌های الاستیک (EWC) 3.2.2-4 Elastic Weight Consolidation ( EWC)

  • توضیح مثال کد ۳.۲.۲ Code Eg 3.2.2 Explaination

  • ۳.۲.۳ ۱ درک CNNها از پیکسل‌ها تا آموزش پیشرفته 3.2.3-1 Understanding CNNs From Pixels to Advanced Training

  • ۳.۲.۳ ۲ نکات حرفه‌ای برای آموزش موفق مدل در بینایی ماشین 3.2.3-2 Pro-Tips for successful model training in Computer Vision

  • ۳.۲.۳ ۳ گردش کار عملی از صفر تا صد 3.2.3-3 Practical Workflow From Zero to Hero

  • توضیح مثال کد ۳.۲.۳ Code Eg 3.2.3 Explaination

  • ۳.۳ بهبود عملکرد مدل CNN اهداف یادگیری 3.3 Improving CNN Model Performance - Learning Objectives

  • ۳.۳.۱ ۱ تشخیص مشکل بیش‌برازش (واریانس بالا) 3.3.1-1 Diagnosing the Problem Overfitting ( High Variance)

  • ۳.۳.۱ ۲ تشخیص مشکل کم‌برازش (بایاس بالا) 3.3.1-2 Diagnosing the Problem Underfitting ( High Bias )

  • ۳.۳.۱ ۳ دو روش برای بهبود عملکرد مدل 3.3.1-3 Two Methods for Improving Model Performance

  • ۳.۳.۱ ۴ بهبود استحکام و تعمیم‌پذیری مدل 3.3.1-4 Improving Model Performance Robustness & Generalization

  • مثال کد ۳.۳.۱ Code Eg 3.3.1

  • ۳.۳.۲ ۱ افزایش داده‌ها (Data Augmentation) چگونه و چرا 3.3.2-1 Data Augmentation How & Why

  • ۳.۳.۲ ۲ افزایش داده‌ها تظاهر تا رسیدن به نتیجه 3.3.2-2 Data Augmentation Fake It Till You Make It

  • ۳.۳.۲ ۳ افزایش داده‌ها زرادخانه هندسی 3.3.2-3 Data Augmentation The Geometric Arsenal

  • ۳.۳.۲ ۴ افزایش داده‌ها زرادخانه فوتومتریک و MixUp 3.3.2-4 Data Augmentation The Photometric Arsenal & MixUp

  • مثال کد ۳.۳.۲ Code Eg. 3.3.2

  • ۳.۳.۳.۱ منظم‌سازی محدود کردن مدل Dropout 3.3.3.1 Regularization Restraining the Model - Dropout

  • ۳.۳.۳ ۲ کاهش وزن (L2 Regularization) 3.3.3-2 Weight Decay (L2 Regularization)

  • ۳.۳.۳ ۳ هموارسازی برچسب مبارزه با اعتماد به نفس بیش از حد 3.3.3-3 Label Smoothing - Fighting Overconfidence

  • مثال کد ۳.۳.۳ Code Eg. 3.3.3

  • ۳.۳.۴.۱ اثر هم‌افزایی افزایش داده‌ها و منظم‌سازی 3.3.4.1 The Synergy Effect Data Augmentation Regularization

  • ۳.۳.۴ ۲ جمع‌بندی نهایی 3.3.4-2 Putting It All Together

  • مثال کد ۳.۳.۴ Code Eg. 3.3.4

ماژول ۴: تشخیص اشیاء با یادگیری عمیق Module 4: Object Detection with Deep Learning

  • ماژول ۴: تشخیص اشیاء با یادگیری عمیق مقدمه Module 4: Object Detection with Deep Learning - Intro

  • ۴.۱ مقدمه‌ای بر تشخیص اشیاء اهداف سخنرانی 4.1 Introduction to Object Detection - Lecture Objectives

  • ۴.۱.۱ ۱ مقدمه تشخیص اشیاء 4.1.1-1 Introduction to Object Detection

  • ۴.۱.۱ ۲ تعریف تسک چه چیزی و کجا 4.1.1-2 Defining the Task The What and the Where

  • ۴.۱.۱ ۳ ساختار خروجی تشخیص 4.1.1-3 The Structure of Detection Output

  • مثال کد ۴.۱ بخش ۱ Code Eg. 4.1 part 1

  • ۴.۱.۲ ۱ مثال بصری تلاقی بر اجتماع (IoU) در عمل 4.1.2-1 Visual Example Intersection over Union (IoU) in Practice

  • ۴.۱.۲ ۲ معیارهای IoU (Intersection over Union) 4.1.2-2 The Metrics Intersection over Union (IoU)

  • ۴.۱.۲ ۳ تفسیر مقادیر خوب، بد و زشت IoU 4.1.2-3 The Good , the Bad and the Ugly of IoU values

  • مثال کد ۴.۱ بخش ۲ Code Eg. 4.1 part 2

  • ۴.۱.۳ ۱ توازن Precision-Recall و نمایش هندسی mAP 4.1.3-1 Precision-Recall Tradeoff & mAP Geometrical Representation

  • ۴.۱.۳ ۲ میانگین دقت متوسط (mAP) محاسبه گام به گام 4.1.3-2 Mean Average Precision (mAP) Step-wise calculation

  • ۴.۱.۳ ۳ تفسیر مقادیر mAP 4.1.3-3 Mean Average Precision (mAP) Values interpretation

  • مثال کد ۴.۱ بخش ۳ Code Eg. 4.1 part 3

  • ۴.۱.۴ ۱ سرکوب غیر حداکثر (NMS) 4.1.4-1 Non Maximum Suppression

  • ۴.۱.۴ ۲ توضیح NMS با یک مثال 4.1.4-2 Non-Maximum Suppression (NMS) Explained by an Example

  • ۴.۱.۴ ۳ تشخیص اشیاء خط لوله سطح بالا 4.1.4-3 Object Detection The High-Level Pipeline

  • مثال کد ۴.۱ بخش ۴ Code Eg. 4.1 part 4

  • ۴.۲ تشخیص‌دهنده‌های دو مرحله‌ای (خانواده R-CNN) اهداف یادگیری 4.2 Two-Stage Detectors (R-CNN Family) - Learning Objectives

  • ۴.۲.۱.۱ رویکرد و تکامل تشخیص‌دهنده‌های دو مرحله‌ای 4.2.1.1 Two-Stage Detectors Approach & Evolution

  • ۴.۲.۱.۲ تشخیص‌دهنده‌های دو مرحله‌ای خانواده R-CNN 4.2.1.2 Two-Stage Detectors The R-CNN Family

  • مثال کد ۴.۲ بخش ۱ Code Eg. 4.2 part 1

  • ۴.۲.۲ ۱ مدل R-CNN (۲۰۱۴) و مشکلات آن 4.2.2-1 R-CNN (2014) & the problem

  • ۴.۲.۲ ۲ مدل Fast R-CNN (۲۰۱۵) توضیح با مثال 4.2.2-2 Fast R-CNN (2015) Explained with an example

  • ۴.۲.۲ ۳ مدل Fast R-CNN (۲۰۱۵) مغز مشترک 4.2.2-3 Fast R-CNN (2015) The Shared Brain

  • مثال کد ۴.۲ بخش ۲ Code Eg. 4.2 part 2

  • ۴.۲.۳ ۱ مدل Faster R-CNN (۲۰۱۵) نوآوری شبکه پیشنهاد منطقه (RPN) 4.2.3-1 Faster R-CNN (2015) The Region Proposal Network (RPN) Innovation

  • ۴.۲.۳.۲ مدل Faster R-CNN (۲۰۱۵) استاندارد مدرن 4.2.3.2 Faster R-CNN (2015) The Modern Standard

  • ۴.۲.۳.۳ مدل Faster R-CNN (۲۰۱۵) خط لوله کامل 4.2.3.3 Faster R CNN (2015) The Full Pipeline

  • ۴.۲.۳.۴ مقایسه خانواده R-CNN تکامل 4.2.3.4 R CNN Family Comparison The Evolution

  • مثال کد ۴.۲ بخش ۳ Code Eg. 4.2 part 3

  • ۴.۳ تشخیص‌دهنده‌های تک مرحله‌ای (YOLO, SSD) اهداف یادگیری 4.3 Single-Stage Detectors (YOLO, SSD) - Learning Objectives

  • ۴.۳.۱.۱ تغییر از تشخیص‌دهنده دو مرحله‌ای به تک مرحله‌ای 4.3.1.1 Shift from Two Stage to Single Stage Object Detector

  • ۴.۳.۱.۲ انقلاب رگرسیون در مقابل پیشنهاد 4.3.1.2 The Revolution Regression vs. Proposal

  • ۴.۳.۱.۳ تفاوت‌های ریاضی و عملیاتی R-CNN در مقابل YOLO 4.3.1.3 Mathematical & Operational Differences R CNN vs Yolo

  • مثال کد ۴.۳ بخش ۱ Code Eg. 4.3 part 1

  • ۴.۳.۲.۱ مدل YOLO فقط یک بار نگاه کن 4.3.2.1 YOLO You Only Look Once

  • ۴.۳.۲.۲ ریاضیات تابع زیان YOLO 4.3.2.2 Yolo’s Math of the Loss Function

  • ۴.۳.۲.۳ محدودیت‌های مدل YOLOv1 4.3.2.3 The Limitation of YOLOv1 Model

  • مثال کد ۴.۳ بخش ۲ Code Eg. 4.3 part 2

  • ۴.۳.۳.۱ مدل SSD هرم ویژگی‌های چند مقیاسی 4.3.3.1 SSD The Multi Scale Feature Pyramid

  • ۴.۳.۳.۲ مدل SSD جعبه‌های لنگر (Default Boxes) 4.3.3.2 SSD Anchor Boxes (Default Boxes)

  • مثال کد ۴.۳ بخش ۳ Code Eg. 4.3 part 3

  • ۴.۳.۴ مقایسه تشخیص‌دهنده‌ها و راهنمای عملی 4.3.4 Detector Comparison & Practical Guidance

  • مثال کد ۴.۳ بخش ۴ Code Eg. 4.3 part 4

  • ۴.۴ معماری‌های مدرن: تشخیص‌دهنده‌های End-to-End (DETR) اهداف یادگیری 4.4 Modern Architectures: End-to-End Detectors (DETR) - Learning Objectives

  • ۴.۴.۱.۱ معماری‌های مدرن تشخیص‌دهنده‌های End-to-End (DETR) 4.4.1.1 Modern Architectures End to End Detectors (DETR)

  • ۴.۴.۱.۲ متد مدل ترنسفورمر تشخیص (DETR) 4.4.1.2 Detection Transformer (DETR) Model method

  • ۴.۴.۱.۳ نوآوری اصلی ترنسفورمرها در بینایی 4.4.1.3 The Core Innovation Transformers in Vision

  • مثال کد ۴.۴ بخش ۱ Code Eg. 4.4 part 1

  • ۴.۴.۲.۱ خط لوله DETR (۱ از ۳) بدنه (Backbone) 4.4.2.1 The DETR Pipeline (1 of 3) The Backbone

  • ۴.۴.۲.۲ خط لوله DETR (۲ از ۳) رمزگذار ترنسفورمر 4.4.2.2 The DETR Pipeline (2 of 3) The Transformer Encoder

  • ۴.۴.۲.۳ خط لوله DETR (۳ از ۳) رمزگشا و پیش‌بینی‌ها 4.4.2.3 The DETR Pipeline (33) Decoder & Predictions

  • ۴.۴.۲.۴ خط لوله DETR شبکه‌های FFN پیش‌بینی 4.4.2.4 The DETR Pipeline Prediction FFNs

  • مثال کد ۴.۴ بخش ۲ Code Eg. 4.4 part 2

  • ۴.۴.۳.۱ گردش کار کامل DETR 4.4.3.1 DETR Complete workflow

  • ۴.۴.۳.۲ فرمول جادویی زیان تطبیق دوپارتی (Bipartite Matching Loss) 4.4.3.2 The Secret Sauce Bipartite Matching Loss

  • ۴.۴.۳.۳ مدل DETR در مقابل جهان تغییر پارادایم 4.4.3.3 DETR vs. The World A Paradigm Shift

  • مثال کد ۴.۴ بخش ۳ Code Eg. 4.4 part 3

ماژول ۵: بخش‌بندی تصویر با یادگیری عمیق Module 5: Image Segmentation with Deep Learning

  • ماژول ۵: بخش‌بندی تصویر با یادگیری عمیق مقدمه Module 5: Image Segmentation with Deep Learning - Introduction

  • ماژول ۵: بخش‌بندی تصویر با یادگیری عمیق مقدمه Module 5: Image Segmentation with Deep Learning - Intro

  • ۵۱۱۱ بخش‌بندی معنایی در مقابل بخش‌بندی نمونه 5111 Semantic vs. Instance Segmentation

  • ۵۱۱۲ هدف طبقه‌بندی در سطح پیکسل 5112 The Goal Pixel-Level Classification

  • توضیح مثال کد ۵.۱ بخش ۱ Code Eg 5.1 part 1 Explaination

  • ۵۱۲۱ بخش‌بندی معنایی معماری 5121 Semantic Segmentation The Architecture

  • ۵۱۲۲ بخش‌بندی معنایی مفاهیم 5122 Semantic Segmentation The Stuff

  • ۵۱۲۳ بینش ریاضی (زیان پیکسل به پیکسل) 5123 Mathematical Insight (Pixel-wise Loss)

  • توضیح مثال کد ۵.۱ بخش ۲ Code Eg 5.1 part 2 Explaination

  • ۵۱۳۱ بخش‌بندی نمونه معماری 5131 Instance Segmentation The Architecture

  • ۵۱۳۲ بخش‌بندی نمونه اشیاء 5132 Instance Segmentation : " The Things "

  • ۵۱۳۳ بینش ریاضی زیان ترکیبی چند-تسک 5133 Mathematical Insight Hybrid Multi-Task Loss

  • توضیح مثال کد ۵.۱ بخش ۳ Code Eg 5.1 part 3 Explaination

  • ۵.۲ معماری‌های بخش‌بندی معنایی (FCN, U-Net) اهداف یادگیری 5.2 Architectures for Semantic Segmentation (FCN, U-Net) - Learning Objectives

  • ۵۲۱۱ تکامل معماری بخش‌بندی معنایی 5211 Semantic Segmentation Architecture Evolution

  • ۵۲۱۲ مشکل اصلی از برچسب جهانی تا نقشه پیکسلی 5212 The Core Problem From Global Label to Pixel Map

  • ۵۲۱۳ راهکار معماری‌ها 5213 The Architectures' Solution

  • توضیح مثال کد ۵.۲ بخش ۱ Code Eg 5.2 part 1 Explaination

  • ۵۲۲۱ طراحی رمزگذار-رمزگشا (۱ از ۲) رمزگذار 5221 The Encoder Decoder Design (1 of 2) The Encoder

  • ۵۲۲۲ طراحی رمزگذار-رمزگشا (۲ از ۲) رمزگشا 5222 The Encoder-Decoder Design (2 of 2) The Decoder

  • توضیح مثال کد ۵.۲ بخش ۲ Code Eg 5.2 part 2 Explaination

  • ۵۲۳۱ متد شبکه کاملاً پیچشی (FCN) 5231 Fully Convolutional Network Method

  • ۵۲۳۲ طراحی شبکه کاملاً پیچشی 5232 Fully Convolutional Network Design

  • ۵۲۳۳ مشکل گلوگاه و راهکار اتصال Skip 5233 The Bottleneck Problem & The Skip Connection Solution

  • توضیح مثال کد ۵.۲ بخش ۳ Code Eg 5.2 part 3 Explaination

  • ۵۲۴۱ متد بخش‌بندی معنایی U-Net 5241 U-Net Semantic Segmentation Method

  • ۵۲۴۲ دقت جراحی U-Net (۲۰۱۵) 5242 U-Net Surgical Precision (2015)

  • ۵۲۴۳ چرا الحاق (Concatenation) بهتر است 5243 Why Concatenation is Better

  • ۵۲۴۴ مقایسه FCN و U-Net و کاربردهای دنیای واقعی 5244 FCN vs. U-Net & Real-World Applications

  • توضیح مثال کد ۵.۲ بخش ۴ Code Eg 5.2 part 4 Explaination

  • ۵.۳ معماری‌های بخش‌بندی نمونه (Mask R-CNN) اهداف یادگیری 5.3 Architectures for Instance Segmentation (Mask R-CNN) - Learning Objectives

  • ۵۳۱۱ معماری‌های بخش‌بندی نمونه (Mask R-CNN) 5311 Architectures for Instance Segmentation (Mask R-CNN)

  • ۵۳۱۲ گسترش معماری Faster R-CNN با Mask Head 5312 Extending Faster R-CNN Architecture with Mask Head

  • ۵۳۱۳ ترفند جداسازی ماسک‌های مستقل از کلاس 5313 The Decoupling Trick Class-Agnostic Masks

  • توضیح مثال کد ۵.۳ بخش ۱ Code Eg 5.3 part 1 Explaination

  • ۵۳۲۱ مشکل خطای کوانتایزاسیون در ROI Pooling 5321 The Problem ROI Pooling's Quantization Error

  • ۵۳۲۲ راهکار ROI Align 5322 The Solution ROI Align

  • ۵۳۳۳ مکانیسم‌های ریاضی Mask R-CNN 5333 Mathematical Mechanics of Mask R-CNN

  • توضیح مثال کد ۵.۳ بخش ۲ Code Eg 5.3 part 2 Explaination

  • ۵.۴ مدل‌های پایه برای بخش‌بندی (SAM) اهداف یادگیری 5.4 Foundation Models for Segmentation (SAM) - Learning Objectives

  • ۵۴۱۱ مدل SAM به عنوان لحظه GPT برای تصاویر 5411 SAM as GPT moment for Images

  • ۵۴۱۲ مدل‌های پایه برای بخش‌بندی (SAM) 5412 Foundation Models for Segmentation (SAM)

  • ۵۴۱۳ تغییر از مدل‌های متخصص به مدل‌های همه‌کاره 5413 The Shift From Specialists to Generalists

  • توضیح مثال کد ۵.۴ بخش ۱ Code Eg 5.4 part 1 Explaination

  • ۵۴۲۱ بررسی کلی معماری SAM 5421 SAM Architecture Overview

  • ۵۴۲۲ معماری SAM (۱ از ۲) رمزگذار تصویر 5422 SAM Architecture (12) The Image Encoder

  • ۵۴۲۳ معماری SAM (۲ از ۲) رمزگذار پرامپت (مترجم) 5423 SAM Architecture (22) The Prompt Encoder (The Translator)

  • ۵۴۲۴ معماری SAM (۳ از ۳) رمزگشای ماسک (هنرمند) 5424 SAM Architecture (33) The Mask Decoder (The Artist)

  • توضیح مثال کد ۵.۴ بخش ۲ Code Eg 5.4 part 2 Explaination

  • ۵۴۳۱ معماری و تکامل SAM 2 5431 SAM 2 Architecture & Evolution

  • ۵۴۳۲ معماری و تکامل SAM 3 5432 SAM 3 Architecture & Evolution

  • ۵۴۳۳ مقایسه SAM در مقابل SAM 2 و SAM 3 و کاربردهای واقعی 5433 Comparison SAM vs SAM 2 vs SAM 3 & Real world applications

  • توضیح مثال کد ۵.۴ بخش ۳ Code Eg 5.4 part 3 Explaination

ماژول ۶: مدل‌های مولد و فراتر از CNNها Module 6: Generative Models & Beyond CNNs

  • ماژول ۶: مدل‌های مولد و فراتر از CNNها مقدمه Module 6: Generative Models & Beyond CNNs - Intro

  • ۶.۱ خودرمزگذارها (AEs) و خودرمزگذارهای متغیر (VAEs) اهداف یادگیری 6.1 Autoencoders (AEs) and Variational Autoencoders (VAEs) - Learning Objectives

  • ۶۱۱۱ خودرمزگذارها (AEs) در مقابل خودرمزگذار متغیر 6111 Autoencoders (AEs) vs. Variational Autoencoder

  • ۶۱۱۲ فضای محیطی (آشوب)، منیفولد، فضای نهفته (Latent Space) 6112 Ambient Space (The Chaos), Manifold,Latent Space

  • ۶۱۱۳ هسته هوش مصنوعی مولد: منیفولد، فضای نهفته و خودرمزگذارها 6113 The Core of Gen AI: Manifold, Latent Space & Autoencoders

  • ۶۱۱۴ رمزگشا از نقشه به تصویر 6114 The Decoder - From Blueprint Back to Image

  • توضیح مثال کد ۶.۱ بخش ۱ Code Eg 6.1 part 1 Explaination

  • ۶۱۲۱ بررسی کلی معماری خودرمزگذار (AE) 6121 Autoencoder (AE) Architecture Overview

  • ۶۱۲۲ پیاده‌سازی و محدودیت‌های خودرمزگذار 6122 Autoencoder Implementation & Limitations

  • ۶۱۲۳ تابع زیان خودرمزگذار 6123 Autoencoder Loss function

  • توضیح مثال کد ۶.۱ بخش ۲ Code Eg 6.1 part 2 Explaination

  • ۶۱۳۱ بررسی کلی معماری خودرمزگذار متغیر (VAE) 6131 Variational Auto-encoder (VAE) Architecture Overview

  • ۶۱۳۲ خودرمزگذارهای متغیر انقلاب احتمالات 6132 Variational Autoencoders The Probabilistic Revolution

  • ۶۱۳۳ ترفند بازپارامتری‌سازی در بینایی ماشین مولد (VAE) 6133 The Reparameterization Trick in Generative Computer Vision (VAE)

  • ۶۱۳۴ درک زیان VAE و نبرد AE در مقابل VAE 6134 Understanding VAE Loss & The AE vs VAE Showdown

  • توضیح مثال کد ۶.۱ بخش ۳ Code Eg 6.1 part 3 Explaination

  • ۶۱۴۱ مقایسه AE در مقابل VAE 6141 AE vs. VAE Comparison

  • ۶۱۴۲ مدل beta-VAE نمایش‌های تفکیک شده 6142 β-VAE Disentangled Representations

  • ۶۱۴۳ خودرمزگذار متغیر شرطی (cVAE) 6143 Conditional VAE (cVAE)

  • ۶۱۴۴ کاربردهای دنیای واقعی AEها و VAEها 6144 Real-World Applications of AEs & VAEs

  • توضیح مثال کد ۶.۱ بخش ۴ Code Eg 6.1 part 4 Explaination

  • ۶.۲ شبکه‌های رقابتی مولد (GANs) اهداف یادگیری 6.2 Generative Adversarial Networks (GANs) - Learning Objectives

  • ۶۲۱۱ شبکه‌های رقابتی مولد (GANs) 6211 Generative Adversarial Networks (GANs)

  • ۶۲۱۲ حلقه آموزش GAN مسیر رسیدن به تعادل نش 6212 GAN Training Loop Path to Nash Equilibrium

  • ۶۲۱۳ موتور ریاضی بازی مین-ماکس 6213 The Mathematical Engine - The Minimax Game

  • توضیح مثال کد ۶.۲ بخش ۱ Code Eg 6.2 part 1 Explaination

  • ۶۲۲۱ معماری DCGAN نقشه راه GANهای پایدار 6221 DCGAN Architecture The Blueprint for Stable GANs

  • ۶۲۲۲ طراحی آموزش GAN بخش ۱ آموزش تشخیص‌دهنده 6222 GAN Training Choreography 1 Discriminator Training

  • ۶۲۲۳ طراحی آموزش GAN بخش ۲ آموزش مولد 6223 GAN Training Choreography Part 2 Generator Training

  • ۶۲۲۴ طراحی کامل آموزش 6224 The Complete Choreography

  • توضیح مثال کد ۶.۲ بخش ۲ Code Eg 6.2 part 2 Explaination

  • ۶۲۳۱ چالش‌های GAN فروپاشی مود و گرادیان‌های ناپدیدشونده 6231 GAN Challenges - Mode Collapse & Vanishing Gradients

  • ۶۲۳۲ راهکار Wasserstein GAN (WGAN) 6232 The Solution - Wasserstein GAN (WGAN)

  • ۶۲۳۳ مزایای WGAN و جزئیات پیاده‌سازی 6233 Advantages of WGAN & Implementation Details

  • توضیح مثال کد ۶.۲ بخش ۳ Code Eg 6.2 part 3 Explaination

  • ۶۲۴۱ معماری StyleGAN سنتز تفکیک شده 6241 StyleGAN Architecture The Disentangled Synthesis

  • ۶۲۴۲ معماری‌های پیشرفته GAN مدل StyleGAN 6242 Advanced GAN Architectures StyleGAN

  • ۶۲۴۳ مدل CycleGAN تبدیل تصویر به تصویر بدون جفت 6243 CycleGAN Unpaired Image to Image Translation

  • ۶۲۴۴ تبدیل CycleGAN بدون داده‌های جفت شده 6244 CycleGAN Translation Without Paired Data

  • ۶۲۴۵ ارزیابی معیارهای GAN بدون نظارت 6245 Evaluating the Unsupervised GAN Metrics

  • توضیح مثال کد ۶.۲ بخش ۴ Code Eg 6.2 part 4 Explaination

  • ۶.۳ مقدمه‌ای بر ترنسفورمرهای بینایی (ViT) اهداف یادگیری 6.3 Introduction to Vision Transformers (ViT) - Learning Objectives

  • ۶۳۱۱ ترنسفورمرهای بینایی (ViT) تغییر پارادایم 6311 Vision Transformers (ViT) - The Paradigm Shift

  • ۶۳۱۲ معماری ترنسفورمر بینایی (ViT) 6312 The Vision Transformer ( ViT) Architecture

  • ۶۳۱۳ چرا بینایی به یک دید جهانی نیاز دارد 6313 Why Vision Needs a Global View

  • ۶۳۱۴ مقایسه CNN در مقابل ViT داستانی از دو دیدگاه 6314 CNN vs. ViT A Tale of Two Perspectives

  • توضیح مثال کد ۶.۳ بخش ۱ Code Eg 6.3 part 1 Explaination

  • ۶۳۲۱ موتور بینایی توضیح Self Attention 6321 The Engine of Vision - Self-Attention Explained

  • ۶۳۲۲ خود-توجهی و توجه چند-سره (Multi-head attention) 6322 Self-Attention & Multi-head attention

  • ۶۳۲۳ از پیکسل‌ها به توکن‌ها فرآیند تکه-تکه کردن (Patching) در ViT 6323 From Pixels to Tokens - The ViT Patching Process

  • ۶۳۲۴ گام ۱ تبدیل تکه‌ها به جاسازی‌های توکن (Token Embeddings) 6324 Step 1 - Flattening Patches to Token Embeddings

  • ۶۳۲۵ خط لوله کامل 6325 The Complete Pipeline

  • ۶۳۲۶ گام ۲ تصویر خطی از پیکسل‌ها به کلمات بصری 6326 Step -2 Linear Projection From Pixels to Visual Words

  • توضیح مثال کد ۶.۳ بخش ۲ Code Eg 6.3 part 2 Explaination

  • ۶۳۳۱ گام ۳ کدگذاری موقعیتی حافظه فضایی بینایی 6331 Step 3 - Positional Encoding Vision Spatial Memor

  • ۶۳۳۲ گام ۴ رمزگذار ترنسفورمر هسته پردازشی 6332 Step 4 - Transformer Encoder The Processing Core

  • ۶۳۳۳ نرمال‌سازی لایه، MLP و اتصالات باقی‌مانده 6333 Layer Normalisation, MLP & Residual Connections

  • توضیح مثال کد ۶.۳ بخش ۳ Code Eg 6.3 part 3 Explaination

  • ۶۳۴۱ مدل ELA ViT آگاه از چشم‌انداز انرژی 6341 Energy Landscape-Aware ViT (ELA-ViT)

  • ۶۳۴۲ ترنسفورمر بینایی هایپرگراف (HgVT) 6342 Hypergraph Vision Transformer (HgVT)

  • ۶۳۴۳ نوآوری‌های ترنسفورمر بینایی ۲۰۲۵ 6343 2025 Vision Transformer Innovations

  • ۶۳۴۴ ترنسفورمر تصویر بهینه از نظر داده (DeiT) 6344 Data-efficient Image Transformer ( DeiT)

  • ۶۳۴۵ ترنسفورمر Swin ترنسفورمر بینایی سلسله‌مراتبی 6345 Swin Transformer Hierarchial Vision Transformer

  • توضیح مثال کد ۶.۳ بخش ۴ Code Eg 6.3 part 4 Explaination

  • ۶.۴ جاسازی‌های بصری و جستجوی تصویر اهداف یادگیری 6.4 Visual Embeddings and Image Search - Learning Objectives

  • ۶۴۱۱ درک مدل‌های Embedding در بینایی ماشین مولد 6411 Understanding Embedding Models in Generative CV

  • ۶۴۱۲ جاسازی‌های بصری و جستجوی تصویر نقشه تصاویر 6412 Visual Embeddings & Image Search - The Map of Images

  • ۶۴۱۳ از پیکسل‌ها به بردارهای معنایی خط لوله Embedding 6413 From Pixels to Semantic Vectors - The Embedding Pipeline

  • ۶۴۱۴ پیش‌پردازش تصویر در CV مولد تغییر اندازه و نرمال‌سازی 6414 Image Pre-processing in Generative CV Resize & Normalize

  • ۶۴۱۵ نهایی کردن Embedding تصویر و نرمال‌سازی 6415 Finalizing the Embedding - Projection & Normalization

  • ۶۴۱۶ نرمال‌سازی L2 و ارتباط با شباهت کسینوسی 6416 L2 Normalization Resonance with Cosine Similarity

  • توضیح مثال کد ۶.۴ بخش ۱ Code Eg 6.4 part 1 Explaination

  • ۶۴۲۱ مدل SimCLR یادگیری نمایش‌های بصری از نماهای تقویت شده 6421 SimCLR Learning Visual Repr. From Augmented Views

  • ۶۴۲۲ یادگیری مقابله‌ای با SimCLR 6422 Contrastive Learning with SimCLRTeaching

  • ۶۴۲۳ زیان Triplet در تشخیص چهره 6423 Triplet Loss in Face Recognition

  • ۶۴۲۴ جستجوی بهینه یافتن یک تصویر در میان میلیاردها تصویر 6424 Efficient Search - Finding an Image in Billion-Images

  • ۶۴۲۵ استراتژی‌های ایندکس‌گذاری FAISS 6425 FAISS Indexing strategies

  • توضیح مثال کد ۶.۴ بخش ۲ Code Eg 6.4 part 2 Explaination

  • ۶۴۳۱ ایندکس فایل معکوس (IVF) برای جستجوی بهینه 6431 Inverted File Index ( IVF ) for Efficient Search

  • ۶۴۳۲ ایندکس کوانتایزاسیون محصول (PQI) برای جستجوی بهینه 6432 Product Quantization Index (PQI) for Efficient Search

  • ۶۴۳۳ مدل HNSW برای جستجوی بهینه 6433 Hierarchical Navigable Small World ( HNSW) for Efficient Search

  • توضیح مثال کد ۶.۴ بخش ۳ Code Eg 6.4 part 3 Explaination

  • ۶۴۴۱ کاربرد ۱ جستجوی معکوس تصویر 6441 Application 1 Reverse Image Search

  • ۶۴۴۲ تشخیص چهره و ArcFace 6442 Face Recognition & ArcFace

  • ۶۴۴۳ معماری رمزگذار دوگانه CLIP 6443 CLIP Dual-Encoder Architecture

  • ۶۴۴۴ سه کاربرد جستجوی چند-مودال با CLIP 6444 3 Applications of Multimodal search with CLIP

  • توضیح مثال کد ۶.۴ بخش ۴ Code Eg 6.4 part 4 Explaination

نمایش نظرات

آموزش تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و هوش مصنوعی مولد (Gen-CV)
جزییات دوره
34 hours
360
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
1,254
4.8 از 5
دارد
دارد
دارد
Vinit Singh
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Vinit Singh Vinit Singh

مشاور و مدرس هوش مصنوعی