دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و هوش مصنوعی مولد (Gen-CV) - آخرین آپدیت

دانلود Mastering Computer Vision: From Pixel to Detection to Gen-CV bestseller

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: تسلط بر CNNs، ResNet، Inception، YOLO، SSD، U-Net، Mask R-CNN، GANs، ViT، SAM و VAE با استفاده از پایتون، OpenCV و پروژه‌های PyTorch تسلط بر مبانی بینایی ماشین: درک نحوه پردازش و تفسیر داده‌های بصری توسط کامپیوتر، از دستکاری پیکسل‌ها و فضاهای رنگی تا فیلترینگ پیشرفته ساخت و استقرار مدل‌های یادگیری عمیق: طراحی، آموزش و بهینه‌سازی شبکه‌های عصبی پیچشی (CNNs) با استفاده از TensorFlow و PyTorch، شامل معماری‌های پیشرفته پیاده‌سازی سیستم‌های پیشرفته تشخیص اشیاء: توسعه اپلیکیشن‌های تشخیص اشیاء آماده برای محیط تولید با استفاده از YOLO، Faster R-CNN و DETR ایجاد مدل‌های پیشرفته بخش‌بندی (Segmentation) و مولد: ساخت سیستم‌های بخش‌بندی معنایی و نمونه با استفاده از U-Net و Mask R-CNN و ایجاد کاربردهای هوش مصنوعی مولد به‌کارگیری تکنیک‌های یادگیری انتقالی (Transfer Learning) و تنظیم دقیق (Fine-Tuning): بهره‌گیری از مدل‌های پیش‌آموزش‌دیده روی ImageNet برای حل مسائل سفارشی بینایی ماشین توسعه یک پورتفولیوی حرفه‌ای: تکمیل بیش از ۷ پروژه صنعتی شامل طبقه‌بندی تصاویر، تشخیص اشیاء در زمان واقعی، ابزارهای حذف پس‌زمینه و غیره درک تئوری یادگیری عمیق و ریاضیات: تسلط بر مبانی ریاضی شبکه‌های عصبی از جمله پس‌انتشار (Backpropagation)، گرادیان نزولی و توابع زیان تسلط بر ابزارها و فریم‌ورک‌های استاندارد صنعت: کسب مهارت در TensorFlow، PyTorch، OpenCV، scikit-image و متدهای مدرن MLOps برای استقرار مدل آمادگی برای مصاحبه‌های مهندسی بینایی ماشین: توانایی تحلیل و توضیح معماری‌هایی مانند اتصالات باقی‌مانده در ResNet و تشخیص تک-شات در YOLO استقرار مدل‌ها در محیط عملیاتی: یادگیری بهترین روش‌ها برای بهینه‌سازی مدل، کوانتایزیشن، خط لوله‌های استقرار و ارائه مدل‌های بینایی ماشین در دنیای واقعی پیش نیازها: برای بهره‌برداری حداکثری از این دوره، باید تسلط مناسبی بر برنامه‌نویسی پایه پایتون (متغیرها، حلقه‌ها، توابع و شرط‌ها) داشته باشید و با Jupyter Notebook یا IDEهای پایتون آشنا باشید. درک مفاهیم پایه ریاضیات (جبر و حساب دیفرانسیل) مفید است اما الزامی نیست. از نظر سخت‌افزاری، به سیستمی با حداقل ۸ گیگابایت رم نیاز دارید. هیچ تجربه قبلی در یادگیری ماشین یا بینایی ماشین نیاز نیست، زیرا ما از صفر شروع می‌کنیم؛ تنها چیزی که نیاز دارید اشتیاق به یادگیری و کدنویسی است.

تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و Gen-CV

در ۳۴ ساعت از یک یادگیرنده مشتاق به یک مهندس متخصص بینایی ماشین تبدیل شوید

آیا آماده‌اید تکنولوژی‌هایی را بسازید که دنیای بصری ما را شکل می‌دهند؟

بینایی ماشین فقط آینده نیست، بلکه همین حالاست. ماشین‌های خودران در خیابان‌ها حرکت می‌کنند، اپلیکیشن‌ها چهره شما را می‌شناسند و هوش مصنوعی آثار هنری خیره‌کننده خلق می‌کند. پشت هر نوآوری بصری، تکنولوژی بینایی ماشین قرار دارد و تقاضا برای مهندسان ماهر CV هرگز به این اندازه بالا نبوده است. شرکت‌هایی مانند گوگل، تسلا و متا به دنبال متخصصانی هستند که بتوانند سیستم‌های بینایی را بسازند و بهینه کنند.

اما چالش اینجاست: اکثر دوره‌ها یا شما را در تئوری‌های خشک غرق می‌کنند یا بدون ایجاد درک بنیادی، شما را به سراغ فریم‌ورک‌های یادگیری عمیق می‌برند.

این دوره متفاوت است.

دوره «تسلط بر بینایی ماشین» یک مسیر کامل را ارائه می‌دهد؛ از درک نحوه پردازش تک‌تک پیکسل‌ها تا استقرار پیشرفته‌ترین مدل‌های هوش مصنوعی مولد. چه دانشجویی باشید که می‌خواهد متمایز شود، چه متخصصی که قصد تغییر شغل دارد و چه کارآفرینی که در حال ساخت محصولی مبتنی بر بینایی است، این مسیر جامع شما را از صفر به سطح آماده برای استقرار می‌رساند.

چه چیزی این دوره را منحصر به فرد می‌کند؟

معماری یادگیری پیشرونده: ما هیچ مرحله‌ای را نمی‌پرشیم. شما با پردازش کلاسیک تصاویر و مبانی OpenCV شروع می‌کنید تا درک کنید کامپیوتر واقعاً چگونه «می‌بیند». سپس شبکه‌های عصبی پیچشی را فرا می‌گیرید و در نهایت به سراغ معماری‌های لبه تکنولوژی مانند Vision Transformers، DETR و SAM می‌روید.

۳۴ ساعت تمرین عملی: هر مفهوم با کد نمایش داده می‌شود. هر ماژول شامل پروژه‌های کاربردی است. شما فقط ویدیو نمی‌بینید، بلکه اپلیکیشن‌های واقعی را با TensorFlow و PyTorch می‌سازید.

بیش از ۷ پروژه آماده برای پورتفولیو: در پایان دوره، شما یک CNN برای طبقه‌بندی مد با دقت بالای ۹۲٪، یک تشخیص‌دهنده اشیاء YOLO با سرعت ۴۵+ FPS، سیستم حذف پس‌زمینه مبتنی بر U-Net، اپلیکیشن انتقال استایل تصویر، سیستم تشخیص چهره با نقاط کلیدی، ابزار بخش‌بندی Mask R-CNN و مدل‌های سفارشی را ساخته‌اید.

آمادگی برای مصاحبه‌های شغلی: شما با اعتماد به نفس درباره اتصالات ResNet، نوآوری‌های YOLO، اتصالات Skip در U-Net و مکانیسم‌های توجه در Vision Transformers صحبت خواهید کرد. هر معماری با وضوح کامل توضیح داده شده تا بتوانید «چرا»ی هر روش را در مصاحبه‌های فنی توضیح دهید.

این دوره برای چه کسانی است؟

این دوره برای دانشجویان جویای مهارت‌های تخصصی AI، توسعه‌دهندگان نرم‌افزاری که می‌خواهند بینایی ماشین را به ابزارهای خود اضافه کنند، افرادی که قصد تغییر شغل به مهندسی AI را دارند، پژوهشگران نیازمند مهارت‌های پیاده‌سازی عملی و کارآفرینان حوزه محصولات بصری طراحی شده است.

پیش‌نیازها: دانش پایه برنامه‌نویسی پایتون. بقیه موارد را از پایه آموزش می‌دهیم.

مرور کلی سرفصل‌ها

ماژول ۱: مبانی (پردازش تصویر و OpenCV): تسلط بر مفاهیم پایه: نمایش پیکسل، فضاهای رنگی (RGB, HSV, Grayscale)، تبدیلات هندسی و فیلترینگ با کرنل‌های کانولوشن.

ماژول ۲: یادگیری عمیق و CNNها: درک شبکه‌های عصبی از اصول اولیه: نورون‌ها، توابع فعال‌ساز، پس‌انتشار و گرادیان نزولی. سپس درک دلیل برتری CNNها در بینایی ماشین.

ماژول ۳: معماری‌های پیشرفته CNN: بررسی نوآوری‌های برنده ImageNet: عمق VGG، یادگیری باقی‌مانده در ResNet، پردازش چند مقیاسی Inception و مقیاس‌بندی EfficientNet. تسلط بر یادگیری انتقالی برای تطبیق مدل‌های پیش‌آموزش‌دیده با تسک‌های سفارشی.

ماژول ۴: تشخیص اشیاء (Object Detection): ساخت سیستم‌هایی برای شناسایی و مکان‌یابی چندین شیء. بررسی تشخیص‌دهنده‌های دو مرحله‌ای (خانواده R-CNN) و تک مرحله‌ای (YOLO, SSD) برای عملکرد در زمان واقعی و معماری مدرن DETR.

ماژول ۵: بخش‌بندی تصویر (Image Segmentation): طبقه‌بندی در سطح پیکسل برای ایجاد ماسک‌های دقیق. تسلط بر بخش‌بندی معنایی با U-Net و بخش‌بندی نمونه با Mask R-CNN و بررسی مدل‌های پایه مانند SAM.

ماژول ۶: مدل‌های مولد و ترنسفورمرهای بینایی: ورود به مرزهای هوش مصنوعی بصری. درک VAEها، ساخت GANها برای تولید تصاویر واقع‌گرایانه و تسلط بر Vision Transformers (ViT) و مکانیسم‌های توجه جهانی.

در پایان این دوره شما قادر خواهید بود:

بینایی ماشین را از اصول اولیه تا مدل‌های پیشرفته درک کنید (نه فقط استفاده از کتابخانه، بلکه ریاضیات و شهود پشت هر تکنیک).

اپلیکیشن‌های آماده تولید برای تشخیص اشیاء، بخش‌بندی تصاویر و تولید محتوای بصری با عملکرد عالی بسازید.

در مصاحبه‌های فنی شرکت‌های بزرگی مانند گوگل و تسلا با اعتماد به نفس درباره معماری‌های ResNet، YOLO، U-Net و ViT بحث کنید.

سیستم‌های دنیای واقعی را با استفاده از TensorFlow، PyTorch و متدهای MLOps مستقر کنید.

پورتفولیویی شامل بیش از ۷ پروژه صنعتی داشته باشید که تخصص شما را در کل خط لوله بینایی ماشین نشان دهد.

با زبان فنی مهندسان CV صحبت کنید و توازن بین دقت و سرعت، و پیچیدگی مدل و نیازهای استقرار را درک کنید.

تحول شما از همین حالا شروع می‌شود

از دستکاری پیکسل تا هوش مصنوعی مولد؛ شما کل مسیر را فرا می‌گیرید. انقلاب بصری در حال رخ دادن است. سوال این است: آیا شما سازنده آن خواهید بود یا فقط تماشا می‌کنید؟

همین امروز ثبت‌نام کنید و از یک یادگیرنده مشتاق به یک مهندس متخصص بینایی ماشین تبدیل شوید.

این دوره شامل ۳۴ ساعت محتوای ویدئویی، دموهای کدنویسی عملی، بیش از ۷ پروژه کامل، دسترسی مادام‌العمر، گواهینامه پایان دوره و ضمانت بازگشت وجه ۳۰ روزه است.

به دانشجویانی بپیوندید که مسیر شغلی خود را با این مسترکلاس جامع تغییر داده‌اند. سفر شما از مبتدی تا متخصص CV از اینجا شروع می‌شود.

سرفصل ها و درس ها

مقدمه Introduction

ماژول ۱ مبانی بینایی ماشین و پردازش تصویر Module 1 - Foundations of CV & Image Processing
۱.۱ مقدمه‌ای بر بینایی ماشین اهداف یادگیری 1.1 Introduction to Computer Vision - Learning Objectives
۱.۱.۱ ۱ مقدمه بینایی ماشین 1.1.1-1 Introduction to Computer Vision
۱.۱.۱ ۲ بینایی ماشین چیست؟ 1.1.1-2 What is Computer Vision ?
۱.۱.۱ ۳ شکاف معنایی چالش اصلی بینایی ماشین 1.1.1-3 The Semantic Gap The Core Challenge of CV
توضیح مثال کد ۱.۱.۱ Code Eg 1.1.1 Explaination
۱.۱.۲ ۱ تکامل بینایی ماشین 1.1.2-1 The Evolution of Computer Vision
۱.۱.۲ ۲ تشخیص لبه سوبل (Sobel) 1.1.2-2 Sobel Edge Detection
۱.۱.۲ ۳ تشخیص لبه کنی (Canny) 1.1.2-3 Cannny Edge detection
توضیح مثال کد ۱.۱.۲ Code Eg 1.1.2 Explaination
۱.۱.۳ ۱ استخراج ویژگی‌های HoG 1.1.3-1 Extracting HoG Features
۱.۱.۳ ۲ تشخیص ویژگی‌های SIFT 1.1.3-2 Detect SIFT Features
توضیح مثال کد ۱.۱.۳ Code Eg 1.1.3 Explaination
۱.۱.۴ ۱ طبقه‌بندی‌کننده‌های ML روی ویژگی‌های آموخته شده 1.1.4-1 ML Classifiers on learned Features
۱.۱.۴ ۲ آموزش ماشین‌های بردار پشتیبان (SVM) 1.1.4-2 Train Support Vector Machines (SVM)
۱.۱.۴ ۳ آموزش k-نزدیک‌ترین همسایه (KNN) 1.1.4-3 Train k-Nearest neighbour ( KNN )
توضیح مثال کد ۱.۱.۴ Code Eg 1.1.4 Explaination
۱.۱.۵ ۱ عصر دوم عصر یادگیری عمیق 1.1.5-1 Era 2 - The Deep Learning Era
۱.۱.۵ ۲ عصر هوش مصنوعی مولد 1.1.5-2 The Generative AI Era
۱.۱.۵ ۳ گردش کار جهانی بینایی ماشین 1.1.5-3 The Universal Computer Vision Workflow
توضیح تمرین کد ۱.۱ Code Exercise 1.1 Explaination
۱.۲ مبانی تصویر دیجیتال اهداف یادگیری 1.2 Digital Image Fundamentals - Learning Objectives
۱.۲.۱ ۱ مبانی تصویر دیجیتال 1.2.1-1 Digital Image Fundamentals
۱.۲.۱ ۲ پیکسل اتم بینایی 1.2.1-2 Pixel The Atom of Vision
۱.۲.۱ ۳ تصویر به عنوان ماتریس واقعیت ریاضی 1.2.1-3 Image as Matrix - The Maths Reality
۱.۲.۱ ۴ تصاویر رنگی به عنوان ماتریس‌های سه بعدی 1.2.1-4 Color Images as 3D Matrices
توضیح مثال کد ۱.۲.۱ Code Eg 1.2.1 Explaination
۱.۲.۲ ۱ فضاهای رنگی RGB روش افزودنی 1.2.2-1 Color Spaces RGB The Additive
۱.۲.۲ ۲ فضاهای رنگی HSV تشخیص مقاوم 1.2.2-2 Color Spaces HSV Robust Detection
۱.۲.۲ ۳ فضاهای رنگی Grayscale (سیاه و سفید) 1.2.2-3 Color Spaces Grayscale
توضیح مثال کد ۱.۲.۲ Code Eg 1.2.2 Explaination
۱.۲.۳ عمق تصویر (Bit Depth) 1.2.3 Image Depth (Bit Depth)
توضیح مثال کد ۱.۲.۳ Code Eg 1.2.3 Explaination
۱.۲.۴ کار عملی بینایی ماشین با OpenCV 1.2.4 Hands-On CV with OpenCV
توضیح مثال کد ۱.۲.۴ Code Eg 1.2.4 Explaination
توضیح تمرین کد ۱.۲ Code Exercise 1.2 Explaination
۱.۳ تکنیک‌های ضروری پیش‌پردازش تصویر اهداف یادگیری 1.3 Essential Image Preprocessing Techniques - Learning Objectives
۱.۳.۱ ۱ پیش‌پردازش تصویر 1.3.1-1 Image Preprocessing
۱.۳.۱ ۲ تبدیل تصویر 1.3.1-2 Image Transformation
توضیح مثال کد ۱.۳.۱ Code Eg. 1.3.1 Explaination
۱.۳.۲ ۱ تبدیلات هندسی 1.3.2-1 Geometric Transformations
۱.۳.۲ ۲ تبدیل هندسی ۱ مقیاس‌بندی (Scaling) 1.3.2-2 Geometric Transform 1 - Scaling
۱.۳.۲ ۳ تبدیل هندسی ۲ چرخش و انتقال 1.3.2-3 Geometric Transform 2 - Rotation & Translation
۱.۳.۲ ۴ کار عملی با تبدیلات هندسی OpenCV 1.3.2-4 Hands-On OpenCV Geometric Transformations
توضیح مثال کد ۱.۳.۲ Code Eg. 1.3.2 Explaination
۱.۳.۳ تبدیل هندسی ۳ آفین در مقابل پرسپکتیو 1.3.3 Geometric Transform 3 - Affine vs. Perspective
توضیح مثال کد ۱.۳.۳ Code Eg. 1.3.3 Explaination
۱.۳.۴ ۱ ریاضیات تبدیلات هندسی 1.3.4-1 The Math of Geometric Transformations
۱.۳.۴ ۲ تنظیمات فوتومتریک اصلاح نور و کنتراست 1.3.4-2 Photometric Adjustments Fixing Light & Contrast
۱.۳.۴ ۳ تنظیم فوتومتریک یکسان‌سازی هیستوگرام 1.3.4-3 Photometric Adjustment Histogram Equalization
توضیح مثال کد ۱.۳.۴ Code Eg. 1.3.4 Explaination
۱.۳.۵ ۱ فیلترینگ جادوی کانولوشن 1.3.5-1 Filtering The Magic of Convolution
۱.۳.۵ ۲ کرنل‌ها فیلترهای دست‌ساز برای بینایی 1.3.5-2 The Kernels - Handcrafted Filters for Vision
توضیح مثال کد ۱.۳.۵ Code Eg. 1.3.5 Explaination
۱.۳.۶ کاربردی پیش‌پردازش برای تشخیص چهره 1.3.6 Practical - Preprocessing for Face Recognition
توضیح مثال کد ۱.۳.۶ Code Eg. 1.3.6 Explaination
توضیح تمرین کد ۱.۳ Code Exercise 1.3 Explaination

ماژول ۲: مبانی یادگیری عمیق و شبکه‌های عصبی پیچشی (CNNs) Module 2: Deep Learning Foundations & Convolutional Neural Networks (CNNs)

ماژول ۲ مبانی یادگیری عمیق و شبکه‌های عصبی پیچشی (CNN) مقدمه Module 2 Deep Learning Foundations & Convolutional Neural Networks (CNN) - Intro
۲.۱ از پرسپترون‌ها تا شبکه‌های عصبی عمیق اهداف یادگیری 2.1 From Perceptrons to Deep Neural Networks - Learning Objectives
۲.۱.۱ ۱ تاریخچه بینایی ماشین ۱۹۵۰ تا ۱۹۹۰ 2.1.1-1 Computer Vision History 1950-1990s
۲.۱.۱ ۲ عصر مدرن بینایی ماشین ۱۹۹۰ تا کنون 2.1.1-2 Computer Vision Modern Era 1990s - Present
توضیح مثال کد ۲.۱.۱ Code Eg. 2.1.1 Explaination
۲.۱.۲ ۱ لایه ورودی تا اولین لایه پنهان ریاضیات کامل 2.1.2-1 Input Layer to first hidden layer Complete Maths
۲.۱.۲ ۲ تابع فعال‌ساز 2.1.2-2 Activation Function
۲.۱.۲ ۳ لایه پنهان دوم شبکه عصبی 2.1.2-3 Hidden Layer 2 of Neural Network
۲.۱.۲ ۴ نورون لایه خروجی ریاضیات کامل 2.1.2-4 Output Layer Neuron Complete Maths
۲.۱.۲ ۵ انواع لایه‌ها و نقش آن‌ها 2.1.2-5 Layer Types and Their Roles
توضیح مثال کد ۲.۱.۲ Code Eg. 2.1.2 Explaination
۲.۱.۳ ۱ فرآیند یادگیری دو مرحله‌ای گذر پیشرو (Forward Pass) 2.1.3-1 The two step Learninng Process Forward Pass
۲.۱.۳ ۲ زیان انتروپی متقاطع طبقه‌بندی باینری 2.1.3-2 Cross-Entropy Loss Binary Classification
۲.۱.۳ ۳ زیان انتروپی متقاطع طبقه‌بندی چندکلاسه 2.1.3-3 Cross-Entropy Loss Multi-Class Classification
۲.۱.۳ ۴ گذر پس‌رو (Backward Pass) یادگیری از اشتباهات 2.1.3-4 Backward Pass - Learning from mistakes
۲.۱.۳ ۵ گرادیان نزولی 2.1.3-5 Gradient Descent
توضیح مثال کد ۲.۱.۳ Code Eg. 2.1.3 Explaination
۲.۱.۴ ۱ خلاصه فرآیند یادگیری دو مرحله‌ای 2.1.4-1 The two step Learninng Process - Summary
۲.۱.۴ ۲ هایپرپارامتر نرخ یادگیری و نقش بهینه‌ساز 2.1.4-2 The Learning Rate Hyperparameter & Role of Optimizer
توضیح مثال کد ۲.۱.۴ Code Eg. 2.1.4 Explaination
توضیح تمرین کد ۲.۱ Code Exercise 2.1 Explaination
۲.۲ معماری CNN اهداف یادگیری 2.2 The CNN Architecture - Learning Objectives
۲.۲.۱ چرا شبکه‌های DNN در تسک‌های بینایی ماشین شکست می‌خورند 2.2.1 Why DNNs fail at Computer Vision Tasks
توضیح مثال کد ۲.۲.۱ Code Eg. 2.2.1 Explaination
۲.۲.۲ ۱ درک شبکه‌های عصبی پیچشی (CNNs) 2.2.2-1 Understanding Convolutional Neural Networks (CNNs)
۲.۲.۲ ۲ عملیات کانولوشن و فرآیند پنجره لغزان 2.2.2-2 Convolution Operation & Sliding Window Process
۲.۲.۲ ۳ انواع فیلترهای کانولوشن 2.2.2-3 Types of convolution filters
۲.۲.۲ ۴ استرایدها (Strides) و پدینگ (Padding) 2.2.2-4 Strides & Padding
توضیح مثال کد ۲.۲.۲ Code Eg. 2.2.2 Explaination
۲.۲.۳ ۱ فعال‌ساز ReLU و MaxPooling 2.2.3-1 ReLU Activation & MaxPooling
۲.۲.۳ ۲ فعال‌ساز ReLU درک مفهومی 2.2.3-2 ReLU Activation – Conceptual Understanding
۲.۲.۳ ۳ پولینگ درک مفهومی 2.2.3-3 Pooling – Conceptual Understanding
توضیح مثال کد ۲.۲.۳ Code Eg. 2.2.3 Explaination
۲.۲.۴ ۱ مثال CNN دو لایه 2.2.4-1 Two Layered CNN example
۲.۲.۴ ۲ لایه متراکم (Dense) یا کاملاً متصل و لایه خروجی 2.2.4-2 Dense or Fully Connected Layer & Output Layer
۲.۲.۴ ۳ اتصال محلی CNN و اشتراک وزن‌ها 2.2.4-3 CNN Local Connectivity & Weight Sharing
۲.۲.۴ ۴ ناوردایی انتقال و ساخت ویژگی‌های سلسله‌مراتبی 2.2.4-4 Translation Invariance & Hierarchical Feature Building
توضیح مثال کد ۲.۲.۴ Code Eg. 2.2.4 Explaination
توضیح تمرین کد ۲.۲ Code Exercise 2.2 Explaination
۲.۳ ساخت اولین CNN شما اهداف یادگیری 2.3 Building Your First CNN - Learning Objectives
۲.۳.۱ ۱ هدف عملی آموزش یک CNN برای دیدن 2.3.1-1 Hands-On Goal Train a CNN to See!
۲.۳.۱ ۲ داده‌ها مهم‌ترین جزء 2.3.1-2 Data The Most Important Ingredient
۲.۳.۱ ۳ تنسورها به عنوان ورودی داده و GPU به عنوان شتاب‌دهنده 2.3.1-3 Tensors as Data Input, & GPU as accelerator
۲.۳.۱ ۴ مزایای PyTorch 2.3.1-4 The PyTorch Advantage
توضیح مثال کد ۲.۳.۱ Code Eg. 2.3.1 Explaination
۲.۳.۲ ۱ معماری CNN اولین مدل ما 2.3.2-1 CNN Architecture Our First Model
۲.۳.۲ ۲ معماری CNN خروجی لایه به لایه 2.3.2-2 CNN Architecture Layer wise Output
توضیح مثال کد ۲.۳.۲ Code Eg. 2.3.2 Explaination
۲.۳.۳ ۱ گذر پیشرو، پس‌انتشار و ارزیابی 2.3.3-1 Forward Pass, Backpropagation, and Evaluation
۲.۳.۳ ۲ تثلیث آموزش 2.3.3-2 The Training Triad
۲.۳.۳ ۳ استراتژی‌های آموزش موثر و تشخیص‌ها 2.3.3-3 Effective Training Strategies and Diagnostics
۲.۳.۳ ۴ حلقه آموزش جایی که یادگیری واقعی رخ می‌دهد 2.3.3-4 The Training Loop Where Learning Actually Happens
۲.۳.۳ ۵ مشکلات رایج و راهکارها 2.3.3-5 Common Issues and Solutions
توضیح مثال کد ۲.۳.۳ Code Eg. 2.3.3 Explaination
۲.۳.۴ ۱ فراتر از آموزش مدل ما چقدر خوب است 2.3.4-1 Beyond Training How Good Is Our Model
۲.۳.۴ ۲ چک‌لیست آموزش CNN 2.3.4-2 CNN Training The Checklist
توضیح مثال کد ۲.۳.۴ Code Eg. 2.3.4 Explaination
توضیح تمرین کد ۲.۳ Code Exercise 2.3 Explaination

ماژول ۳: معماری‌های پیشرفته CNN و یادگیری انتقالی Module 3: Advanced CNN Architectures and Transfer Learning

ماژول ۳: معماری‌های پیشرفته CNN و یادگیری انتقالی مقدمه Module 3: Advanced CNN Architectures and Transfer Learning - Introduction
۳.۱ معماری‌های شاخص CNN اهداف سخنرانی 3.1 Landmark CNN Architectures - Lecture Objectives
۳.۱.۱ ۱ معماری‌های CNN مدل LeNet 5 (۱۹۹۸) 3.1.1-1 CNN Architectures LeNet-5 (1998)
۳.۱.۱ ۲ تکامل معماری‌های شاخص CNN 3.1.1-2 Evolution of Landmark CNN Architectures
۳.۱.۱ ۳ مدل AlexNet (۲۰۱۲) 3.1.1-3 AlexNet (2012)
توضیح مثال کد ۳.۱.۱ Code Eg 3.1.1 Explaination
۳.۱.۲ ۱ مدل VGGNet (۲۰۱۴) 3.1.2-1 VGGNet (2014)
۳.۱.۲ ۲ مدل ResNet (۲۰۱۵) 3.1.2-2 ResNet (2015)
توضیح مثال کد ۳.۱.۲ Code Eg 3.1.2 Explaination
۳.۱.۳ ۱ مدل Inception (GoogLeNet) ۲۰۱۴ 3.1.3-1 Inception (GoogLeNet) - 2014
۳.۱.۳ ۲ مدل DenseNet ۲۰۱۷ 3.1.3-2 DenseNet - 2017
۳.۱.۳ ۳ مدل EfficientNet (۲۰۱۹) 3.1.3-3 EfficientNet (2019)
۳.۱.۳ ۴ چگونه معماری CNN مناسب (Backbone) را انتخاب کنیم 3.1.3-4 How to choose suitable CNN architecture ( Backbone )
۳.۲ یادگیری انتقالی و تنظیم دقیق اهداف یادگیری 3.2 Transfer Learning and Fine-Tuning - Learning Objectives
۳.۲.۱ ۱ دو رویکرد یادگیری انتقالی و تنظیم دقیق 3.2.1-1 Two Approaches Transfer Learning & Fine-Tuning
۳.۲.۱ ۲ انگیزه چرا از مدل‌های پیش‌آموزش‌دیده استفاده کنیم 3.2.1-2 The Motivation Why Reuse Pre-Trained Models
۳.۲.۱ ۳ استخراج ویژگی انتخاب امن 3.2.1-3 Feature Extraction The Safe Bet
۳.۲.۱ ۴ مکانیسم نحوه پیاده‌سازی استخراج ویژگی 3.2.1-4 Mechanics How to Implement Feature Extraction
توضیح مثال کد ۳.۲.۱ Code Eg 3.2.1 Explaination
۳.۲.۲ ۱ تنظیم دقیق (Fine Tuning) انتخاب با کارایی بالا 3.2.2-1 Fine-Tuning The High Performance Bet
۳.۲.۲ ۲ گام جریان گرادیان 3.2.2-2 The Gradient Flow Step
۳.۲.۲ ۳ نرخ‌های یادگیری تفکیکی کلید آموزش موفق 3.2.2-3 Differential Learning Rates Key to Successful Training
۳.۲.۲ ۴ تثبیت وزن‌های الاستیک (EWC) 3.2.2-4 Elastic Weight Consolidation ( EWC)
توضیح مثال کد ۳.۲.۲ Code Eg 3.2.2 Explaination
۳.۲.۳ ۱ درک CNNها از پیکسل‌ها تا آموزش پیشرفته 3.2.3-1 Understanding CNNs From Pixels to Advanced Training
۳.۲.۳ ۲ نکات حرفه‌ای برای آموزش موفق مدل در بینایی ماشین 3.2.3-2 Pro-Tips for successful model training in Computer Vision
۳.۲.۳ ۳ گردش کار عملی از صفر تا صد 3.2.3-3 Practical Workflow From Zero to Hero
توضیح مثال کد ۳.۲.۳ Code Eg 3.2.3 Explaination
۳.۳ بهبود عملکرد مدل CNN اهداف یادگیری 3.3 Improving CNN Model Performance - Learning Objectives
۳.۳.۱ ۱ تشخیص مشکل بیش‌برازش (واریانس بالا) 3.3.1-1 Diagnosing the Problem Overfitting ( High Variance)
۳.۳.۱ ۲ تشخیص مشکل کم‌برازش (بایاس بالا) 3.3.1-2 Diagnosing the Problem Underfitting ( High Bias )
۳.۳.۱ ۳ دو روش برای بهبود عملکرد مدل 3.3.1-3 Two Methods for Improving Model Performance
۳.۳.۱ ۴ بهبود استحکام و تعمیم‌پذیری مدل 3.3.1-4 Improving Model Performance Robustness & Generalization
مثال کد ۳.۳.۱ Code Eg 3.3.1
۳.۳.۲ ۱ افزایش داده‌ها (Data Augmentation) چگونه و چرا 3.3.2-1 Data Augmentation How & Why
۳.۳.۲ ۲ افزایش داده‌ها تظاهر تا رسیدن به نتیجه 3.3.2-2 Data Augmentation Fake It Till You Make It
۳.۳.۲ ۳ افزایش داده‌ها زرادخانه هندسی 3.3.2-3 Data Augmentation The Geometric Arsenal
۳.۳.۲ ۴ افزایش داده‌ها زرادخانه فوتومتریک و MixUp 3.3.2-4 Data Augmentation The Photometric Arsenal & MixUp
مثال کد ۳.۳.۲ Code Eg. 3.3.2
۳.۳.۳.۱ منظم‌سازی محدود کردن مدل Dropout 3.3.3.1 Regularization Restraining the Model - Dropout
۳.۳.۳ ۲ کاهش وزن (L2 Regularization) 3.3.3-2 Weight Decay (L2 Regularization)
۳.۳.۳ ۳ هموارسازی برچسب مبارزه با اعتماد به نفس بیش از حد 3.3.3-3 Label Smoothing - Fighting Overconfidence
مثال کد ۳.۳.۳ Code Eg. 3.3.3
۳.۳.۴.۱ اثر هم‌افزایی افزایش داده‌ها و منظم‌سازی 3.3.4.1 The Synergy Effect Data Augmentation Regularization
۳.۳.۴ ۲ جمع‌بندی نهایی 3.3.4-2 Putting It All Together
مثال کد ۳.۳.۴ Code Eg. 3.3.4

ماژول ۴: تشخیص اشیاء با یادگیری عمیق Module 4: Object Detection with Deep Learning

ماژول ۴: تشخیص اشیاء با یادگیری عمیق مقدمه Module 4: Object Detection with Deep Learning - Intro
۴.۱ مقدمه‌ای بر تشخیص اشیاء اهداف سخنرانی 4.1 Introduction to Object Detection - Lecture Objectives
۴.۱.۱ ۱ مقدمه تشخیص اشیاء 4.1.1-1 Introduction to Object Detection
۴.۱.۱ ۲ تعریف تسک چه چیزی و کجا 4.1.1-2 Defining the Task The What and the Where
۴.۱.۱ ۳ ساختار خروجی تشخیص 4.1.1-3 The Structure of Detection Output
مثال کد ۴.۱ بخش ۱ Code Eg. 4.1 part 1
۴.۱.۲ ۱ مثال بصری تلاقی بر اجتماع (IoU) در عمل 4.1.2-1 Visual Example Intersection over Union (IoU) in Practice
۴.۱.۲ ۲ معیارهای IoU (Intersection over Union) 4.1.2-2 The Metrics Intersection over Union (IoU)
۴.۱.۲ ۳ تفسیر مقادیر خوب، بد و زشت IoU 4.1.2-3 The Good , the Bad and the Ugly of IoU values
مثال کد ۴.۱ بخش ۲ Code Eg. 4.1 part 2
۴.۱.۳ ۱ توازن Precision-Recall و نمایش هندسی mAP 4.1.3-1 Precision-Recall Tradeoff & mAP Geometrical Representation
۴.۱.۳ ۲ میانگین دقت متوسط (mAP) محاسبه گام به گام 4.1.3-2 Mean Average Precision (mAP) Step-wise calculation
۴.۱.۳ ۳ تفسیر مقادیر mAP 4.1.3-3 Mean Average Precision (mAP) Values interpretation
مثال کد ۴.۱ بخش ۳ Code Eg. 4.1 part 3
۴.۱.۴ ۱ سرکوب غیر حداکثر (NMS) 4.1.4-1 Non Maximum Suppression
۴.۱.۴ ۲ توضیح NMS با یک مثال 4.1.4-2 Non-Maximum Suppression (NMS) Explained by an Example
۴.۱.۴ ۳ تشخیص اشیاء خط لوله سطح بالا 4.1.4-3 Object Detection The High-Level Pipeline
مثال کد ۴.۱ بخش ۴ Code Eg. 4.1 part 4
۴.۲ تشخیص‌دهنده‌های دو مرحله‌ای (خانواده R-CNN) اهداف یادگیری 4.2 Two-Stage Detectors (R-CNN Family) - Learning Objectives
۴.۲.۱.۱ رویکرد و تکامل تشخیص‌دهنده‌های دو مرحله‌ای 4.2.1.1 Two-Stage Detectors Approach & Evolution
۴.۲.۱.۲ تشخیص‌دهنده‌های دو مرحله‌ای خانواده R-CNN 4.2.1.2 Two-Stage Detectors The R-CNN Family
مثال کد ۴.۲ بخش ۱ Code Eg. 4.2 part 1
۴.۲.۲ ۱ مدل R-CNN (۲۰۱۴) و مشکلات آن 4.2.2-1 R-CNN (2014) & the problem
۴.۲.۲ ۲ مدل Fast R-CNN (۲۰۱۵) توضیح با مثال 4.2.2-2 Fast R-CNN (2015) Explained with an example
۴.۲.۲ ۳ مدل Fast R-CNN (۲۰۱۵) مغز مشترک 4.2.2-3 Fast R-CNN (2015) The Shared Brain
مثال کد ۴.۲ بخش ۲ Code Eg. 4.2 part 2
۴.۲.۳ ۱ مدل Faster R-CNN (۲۰۱۵) نوآوری شبکه پیشنهاد منطقه (RPN) 4.2.3-1 Faster R-CNN (2015) The Region Proposal Network (RPN) Innovation
۴.۲.۳.۲ مدل Faster R-CNN (۲۰۱۵) استاندارد مدرن 4.2.3.2 Faster R-CNN (2015) The Modern Standard
۴.۲.۳.۳ مدل Faster R-CNN (۲۰۱۵) خط لوله کامل 4.2.3.3 Faster R CNN (2015) The Full Pipeline
۴.۲.۳.۴ مقایسه خانواده R-CNN تکامل 4.2.3.4 R CNN Family Comparison The Evolution
مثال کد ۴.۲ بخش ۳ Code Eg. 4.2 part 3
۴.۳ تشخیص‌دهنده‌های تک مرحله‌ای (YOLO, SSD) اهداف یادگیری 4.3 Single-Stage Detectors (YOLO, SSD) - Learning Objectives
۴.۳.۱.۱ تغییر از تشخیص‌دهنده دو مرحله‌ای به تک مرحله‌ای 4.3.1.1 Shift from Two Stage to Single Stage Object Detector
۴.۳.۱.۲ انقلاب رگرسیون در مقابل پیشنهاد 4.3.1.2 The Revolution Regression vs. Proposal
۴.۳.۱.۳ تفاوت‌های ریاضی و عملیاتی R-CNN در مقابل YOLO 4.3.1.3 Mathematical & Operational Differences R CNN vs Yolo
مثال کد ۴.۳ بخش ۱ Code Eg. 4.3 part 1
۴.۳.۲.۱ مدل YOLO فقط یک بار نگاه کن 4.3.2.1 YOLO You Only Look Once
۴.۳.۲.۲ ریاضیات تابع زیان YOLO 4.3.2.2 Yolo’s Math of the Loss Function
۴.۳.۲.۳ محدودیت‌های مدل YOLOv1 4.3.2.3 The Limitation of YOLOv1 Model
مثال کد ۴.۳ بخش ۲ Code Eg. 4.3 part 2
۴.۳.۳.۱ مدل SSD هرم ویژگی‌های چند مقیاسی 4.3.3.1 SSD The Multi Scale Feature Pyramid
۴.۳.۳.۲ مدل SSD جعبه‌های لنگر (Default Boxes) 4.3.3.2 SSD Anchor Boxes (Default Boxes)
مثال کد ۴.۳ بخش ۳ Code Eg. 4.3 part 3
۴.۳.۴ مقایسه تشخیص‌دهنده‌ها و راهنمای عملی 4.3.4 Detector Comparison & Practical Guidance
مثال کد ۴.۳ بخش ۴ Code Eg. 4.3 part 4
۴.۴ معماری‌های مدرن: تشخیص‌دهنده‌های End-to-End (DETR) اهداف یادگیری 4.4 Modern Architectures: End-to-End Detectors (DETR) - Learning Objectives
۴.۴.۱.۱ معماری‌های مدرن تشخیص‌دهنده‌های End-to-End (DETR) 4.4.1.1 Modern Architectures End to End Detectors (DETR)
۴.۴.۱.۲ متد مدل ترنسفورمر تشخیص (DETR) 4.4.1.2 Detection Transformer (DETR) Model method
۴.۴.۱.۳ نوآوری اصلی ترنسفورمرها در بینایی 4.4.1.3 The Core Innovation Transformers in Vision
مثال کد ۴.۴ بخش ۱ Code Eg. 4.4 part 1
۴.۴.۲.۱ خط لوله DETR (۱ از ۳) بدنه (Backbone) 4.4.2.1 The DETR Pipeline (1 of 3) The Backbone
۴.۴.۲.۲ خط لوله DETR (۲ از ۳) رمزگذار ترنسفورمر 4.4.2.2 The DETR Pipeline (2 of 3) The Transformer Encoder
۴.۴.۲.۳ خط لوله DETR (۳ از ۳) رمزگشا و پیش‌بینی‌ها 4.4.2.3 The DETR Pipeline (33) Decoder & Predictions
۴.۴.۲.۴ خط لوله DETR شبکه‌های FFN پیش‌بینی 4.4.2.4 The DETR Pipeline Prediction FFNs
مثال کد ۴.۴ بخش ۲ Code Eg. 4.4 part 2
۴.۴.۳.۱ گردش کار کامل DETR 4.4.3.1 DETR Complete workflow
۴.۴.۳.۲ فرمول جادویی زیان تطبیق دوپارتی (Bipartite Matching Loss) 4.4.3.2 The Secret Sauce Bipartite Matching Loss
۴.۴.۳.۳ مدل DETR در مقابل جهان تغییر پارادایم 4.4.3.3 DETR vs. The World A Paradigm Shift
مثال کد ۴.۴ بخش ۳ Code Eg. 4.4 part 3

ماژول ۵: بخش‌بندی تصویر با یادگیری عمیق Module 5: Image Segmentation with Deep Learning

ماژول ۵: بخش‌بندی تصویر با یادگیری عمیق مقدمه Module 5: Image Segmentation with Deep Learning - Introduction
ماژول ۵: بخش‌بندی تصویر با یادگیری عمیق مقدمه Module 5: Image Segmentation with Deep Learning - Intro
۵۱۱۱ بخش‌بندی معنایی در مقابل بخش‌بندی نمونه 5111 Semantic vs. Instance Segmentation
۵۱۱۲ هدف طبقه‌بندی در سطح پیکسل 5112 The Goal Pixel-Level Classification
توضیح مثال کد ۵.۱ بخش ۱ Code Eg 5.1 part 1 Explaination
۵۱۲۱ بخش‌بندی معنایی معماری 5121 Semantic Segmentation The Architecture
۵۱۲۲ بخش‌بندی معنایی مفاهیم 5122 Semantic Segmentation The Stuff
۵۱۲۳ بینش ریاضی (زیان پیکسل به پیکسل) 5123 Mathematical Insight (Pixel-wise Loss)
توضیح مثال کد ۵.۱ بخش ۲ Code Eg 5.1 part 2 Explaination
۵۱۳۱ بخش‌بندی نمونه معماری 5131 Instance Segmentation The Architecture
۵۱۳۲ بخش‌بندی نمونه اشیاء 5132 Instance Segmentation : " The Things "
۵۱۳۳ بینش ریاضی زیان ترکیبی چند-تسک 5133 Mathematical Insight Hybrid Multi-Task Loss
توضیح مثال کد ۵.۱ بخش ۳ Code Eg 5.1 part 3 Explaination
۵.۲ معماری‌های بخش‌بندی معنایی (FCN, U-Net) اهداف یادگیری 5.2 Architectures for Semantic Segmentation (FCN, U-Net) - Learning Objectives
۵۲۱۱ تکامل معماری بخش‌بندی معنایی 5211 Semantic Segmentation Architecture Evolution
۵۲۱۲ مشکل اصلی از برچسب جهانی تا نقشه پیکسلی 5212 The Core Problem From Global Label to Pixel Map
۵۲۱۳ راهکار معماری‌ها 5213 The Architectures' Solution
توضیح مثال کد ۵.۲ بخش ۱ Code Eg 5.2 part 1 Explaination
۵۲۲۱ طراحی رمزگذار-رمزگشا (۱ از ۲) رمزگذار 5221 The Encoder Decoder Design (1 of 2) The Encoder
۵۲۲۲ طراحی رمزگذار-رمزگشا (۲ از ۲) رمزگشا 5222 The Encoder-Decoder Design (2 of 2) The Decoder
توضیح مثال کد ۵.۲ بخش ۲ Code Eg 5.2 part 2 Explaination
۵۲۳۱ متد شبکه کاملاً پیچشی (FCN) 5231 Fully Convolutional Network Method
۵۲۳۲ طراحی شبکه کاملاً پیچشی 5232 Fully Convolutional Network Design
۵۲۳۳ مشکل گلوگاه و راهکار اتصال Skip 5233 The Bottleneck Problem & The Skip Connection Solution
توضیح مثال کد ۵.۲ بخش ۳ Code Eg 5.2 part 3 Explaination
۵۲۴۱ متد بخش‌بندی معنایی U-Net 5241 U-Net Semantic Segmentation Method
۵۲۴۲ دقت جراحی U-Net (۲۰۱۵) 5242 U-Net Surgical Precision (2015)
۵۲۴۳ چرا الحاق (Concatenation) بهتر است 5243 Why Concatenation is Better
۵۲۴۴ مقایسه FCN و U-Net و کاربردهای دنیای واقعی 5244 FCN vs. U-Net & Real-World Applications
توضیح مثال کد ۵.۲ بخش ۴ Code Eg 5.2 part 4 Explaination
۵.۳ معماری‌های بخش‌بندی نمونه (Mask R-CNN) اهداف یادگیری 5.3 Architectures for Instance Segmentation (Mask R-CNN) - Learning Objectives
۵۳۱۱ معماری‌های بخش‌بندی نمونه (Mask R-CNN) 5311 Architectures for Instance Segmentation (Mask R-CNN)
۵۳۱۲ گسترش معماری Faster R-CNN با Mask Head 5312 Extending Faster R-CNN Architecture with Mask Head
۵۳۱۳ ترفند جداسازی ماسک‌های مستقل از کلاس 5313 The Decoupling Trick Class-Agnostic Masks
توضیح مثال کد ۵.۳ بخش ۱ Code Eg 5.3 part 1 Explaination
۵۳۲۱ مشکل خطای کوانتایزاسیون در ROI Pooling 5321 The Problem ROI Pooling's Quantization Error
۵۳۲۲ راهکار ROI Align 5322 The Solution ROI Align
۵۳۳۳ مکانیسم‌های ریاضی Mask R-CNN 5333 Mathematical Mechanics of Mask R-CNN
توضیح مثال کد ۵.۳ بخش ۲ Code Eg 5.3 part 2 Explaination
۵.۴ مدل‌های پایه برای بخش‌بندی (SAM) اهداف یادگیری 5.4 Foundation Models for Segmentation (SAM) - Learning Objectives
۵۴۱۱ مدل SAM به عنوان لحظه GPT برای تصاویر 5411 SAM as GPT moment for Images
۵۴۱۲ مدل‌های پایه برای بخش‌بندی (SAM) 5412 Foundation Models for Segmentation (SAM)
۵۴۱۳ تغییر از مدل‌های متخصص به مدل‌های همه‌کاره 5413 The Shift From Specialists to Generalists
توضیح مثال کد ۵.۴ بخش ۱ Code Eg 5.4 part 1 Explaination
۵۴۲۱ بررسی کلی معماری SAM 5421 SAM Architecture Overview
۵۴۲۲ معماری SAM (۱ از ۲) رمزگذار تصویر 5422 SAM Architecture (12) The Image Encoder
۵۴۲۳ معماری SAM (۲ از ۲) رمزگذار پرامپت (مترجم) 5423 SAM Architecture (22) The Prompt Encoder (The Translator)
۵۴۲۴ معماری SAM (۳ از ۳) رمزگشای ماسک (هنرمند) 5424 SAM Architecture (33) The Mask Decoder (The Artist)
توضیح مثال کد ۵.۴ بخش ۲ Code Eg 5.4 part 2 Explaination
۵۴۳۱ معماری و تکامل SAM 2 5431 SAM 2 Architecture & Evolution
۵۴۳۲ معماری و تکامل SAM 3 5432 SAM 3 Architecture & Evolution
۵۴۳۳ مقایسه SAM در مقابل SAM 2 و SAM 3 و کاربردهای واقعی 5433 Comparison SAM vs SAM 2 vs SAM 3 & Real world applications
توضیح مثال کد ۵.۴ بخش ۳ Code Eg 5.4 part 3 Explaination

ماژول ۶: مدل‌های مولد و فراتر از CNNها Module 6: Generative Models & Beyond CNNs

ماژول ۶: مدل‌های مولد و فراتر از CNNها مقدمه Module 6: Generative Models & Beyond CNNs - Intro
۶.۱ خودرمزگذارها (AEs) و خودرمزگذارهای متغیر (VAEs) اهداف یادگیری 6.1 Autoencoders (AEs) and Variational Autoencoders (VAEs) - Learning Objectives
۶۱۱۱ خودرمزگذارها (AEs) در مقابل خودرمزگذار متغیر 6111 Autoencoders (AEs) vs. Variational Autoencoder
۶۱۱۲ فضای محیطی (آشوب)، منیفولد، فضای نهفته (Latent Space) 6112 Ambient Space (The Chaos), Manifold,Latent Space
۶۱۱۳ هسته هوش مصنوعی مولد: منیفولد، فضای نهفته و خودرمزگذارها 6113 The Core of Gen AI: Manifold, Latent Space & Autoencoders
۶۱۱۴ رمزگشا از نقشه به تصویر 6114 The Decoder - From Blueprint Back to Image
توضیح مثال کد ۶.۱ بخش ۱ Code Eg 6.1 part 1 Explaination
۶۱۲۱ بررسی کلی معماری خودرمزگذار (AE) 6121 Autoencoder (AE) Architecture Overview
۶۱۲۲ پیاده‌سازی و محدودیت‌های خودرمزگذار 6122 Autoencoder Implementation & Limitations
۶۱۲۳ تابع زیان خودرمزگذار 6123 Autoencoder Loss function
توضیح مثال کد ۶.۱ بخش ۲ Code Eg 6.1 part 2 Explaination
۶۱۳۱ بررسی کلی معماری خودرمزگذار متغیر (VAE) 6131 Variational Auto-encoder (VAE) Architecture Overview
۶۱۳۲ خودرمزگذارهای متغیر انقلاب احتمالات 6132 Variational Autoencoders The Probabilistic Revolution
۶۱۳۳ ترفند بازپارامتری‌سازی در بینایی ماشین مولد (VAE) 6133 The Reparameterization Trick in Generative Computer Vision (VAE)
۶۱۳۴ درک زیان VAE و نبرد AE در مقابل VAE 6134 Understanding VAE Loss & The AE vs VAE Showdown
توضیح مثال کد ۶.۱ بخش ۳ Code Eg 6.1 part 3 Explaination
۶۱۴۱ مقایسه AE در مقابل VAE 6141 AE vs. VAE Comparison
۶۱۴۲ مدل beta-VAE نمایش‌های تفکیک شده 6142 β-VAE Disentangled Representations
۶۱۴۳ خودرمزگذار متغیر شرطی (cVAE) 6143 Conditional VAE (cVAE)
۶۱۴۴ کاربردهای دنیای واقعی AEها و VAEها 6144 Real-World Applications of AEs & VAEs
توضیح مثال کد ۶.۱ بخش ۴ Code Eg 6.1 part 4 Explaination
۶.۲ شبکه‌های رقابتی مولد (GANs) اهداف یادگیری 6.2 Generative Adversarial Networks (GANs) - Learning Objectives
۶۲۱۱ شبکه‌های رقابتی مولد (GANs) 6211 Generative Adversarial Networks (GANs)
۶۲۱۲ حلقه آموزش GAN مسیر رسیدن به تعادل نش 6212 GAN Training Loop Path to Nash Equilibrium
۶۲۱۳ موتور ریاضی بازی مین-ماکس 6213 The Mathematical Engine - The Minimax Game
توضیح مثال کد ۶.۲ بخش ۱ Code Eg 6.2 part 1 Explaination
۶۲۲۱ معماری DCGAN نقشه راه GANهای پایدار 6221 DCGAN Architecture The Blueprint for Stable GANs
۶۲۲۲ طراحی آموزش GAN بخش ۱ آموزش تشخیص‌دهنده 6222 GAN Training Choreography 1 Discriminator Training
۶۲۲۳ طراحی آموزش GAN بخش ۲ آموزش مولد 6223 GAN Training Choreography Part 2 Generator Training
۶۲۲۴ طراحی کامل آموزش 6224 The Complete Choreography
توضیح مثال کد ۶.۲ بخش ۲ Code Eg 6.2 part 2 Explaination
۶۲۳۱ چالش‌های GAN فروپاشی مود و گرادیان‌های ناپدیدشونده 6231 GAN Challenges - Mode Collapse & Vanishing Gradients
۶۲۳۲ راهکار Wasserstein GAN (WGAN) 6232 The Solution - Wasserstein GAN (WGAN)
۶۲۳۳ مزایای WGAN و جزئیات پیاده‌سازی 6233 Advantages of WGAN & Implementation Details
توضیح مثال کد ۶.۲ بخش ۳ Code Eg 6.2 part 3 Explaination
۶۲۴۱ معماری StyleGAN سنتز تفکیک شده 6241 StyleGAN Architecture The Disentangled Synthesis
۶۲۴۲ معماری‌های پیشرفته GAN مدل StyleGAN 6242 Advanced GAN Architectures StyleGAN
۶۲۴۳ مدل CycleGAN تبدیل تصویر به تصویر بدون جفت 6243 CycleGAN Unpaired Image to Image Translation
۶۲۴۴ تبدیل CycleGAN بدون داده‌های جفت شده 6244 CycleGAN Translation Without Paired Data
۶۲۴۵ ارزیابی معیارهای GAN بدون نظارت 6245 Evaluating the Unsupervised GAN Metrics
توضیح مثال کد ۶.۲ بخش ۴ Code Eg 6.2 part 4 Explaination
۶.۳ مقدمه‌ای بر ترنسفورمرهای بینایی (ViT) اهداف یادگیری 6.3 Introduction to Vision Transformers (ViT) - Learning Objectives
۶۳۱۱ ترنسفورمرهای بینایی (ViT) تغییر پارادایم 6311 Vision Transformers (ViT) - The Paradigm Shift
۶۳۱۲ معماری ترنسفورمر بینایی (ViT) 6312 The Vision Transformer ( ViT) Architecture
۶۳۱۳ چرا بینایی به یک دید جهانی نیاز دارد 6313 Why Vision Needs a Global View
۶۳۱۴ مقایسه CNN در مقابل ViT داستانی از دو دیدگاه 6314 CNN vs. ViT A Tale of Two Perspectives
توضیح مثال کد ۶.۳ بخش ۱ Code Eg 6.3 part 1 Explaination
۶۳۲۱ موتور بینایی توضیح Self Attention 6321 The Engine of Vision - Self-Attention Explained
۶۳۲۲ خود-توجهی و توجه چند-سره (Multi-head attention) 6322 Self-Attention & Multi-head attention
۶۳۲۳ از پیکسل‌ها به توکن‌ها فرآیند تکه-تکه کردن (Patching) در ViT 6323 From Pixels to Tokens - The ViT Patching Process
۶۳۲۴ گام ۱ تبدیل تکه‌ها به جاسازی‌های توکن (Token Embeddings) 6324 Step 1 - Flattening Patches to Token Embeddings
۶۳۲۵ خط لوله کامل 6325 The Complete Pipeline
۶۳۲۶ گام ۲ تصویر خطی از پیکسل‌ها به کلمات بصری 6326 Step -2 Linear Projection From Pixels to Visual Words
توضیح مثال کد ۶.۳ بخش ۲ Code Eg 6.3 part 2 Explaination
۶۳۳۱ گام ۳ کدگذاری موقعیتی حافظه فضایی بینایی 6331 Step 3 - Positional Encoding Vision Spatial Memor
۶۳۳۲ گام ۴ رمزگذار ترنسفورمر هسته پردازشی 6332 Step 4 - Transformer Encoder The Processing Core
۶۳۳۳ نرمال‌سازی لایه، MLP و اتصالات باقی‌مانده 6333 Layer Normalisation, MLP & Residual Connections
توضیح مثال کد ۶.۳ بخش ۳ Code Eg 6.3 part 3 Explaination
۶۳۴۱ مدل ELA ViT آگاه از چشم‌انداز انرژی 6341 Energy Landscape-Aware ViT (ELA-ViT)
۶۳۴۲ ترنسفورمر بینایی هایپرگراف (HgVT) 6342 Hypergraph Vision Transformer (HgVT)
۶۳۴۳ نوآوری‌های ترنسفورمر بینایی ۲۰۲۵ 6343 2025 Vision Transformer Innovations
۶۳۴۴ ترنسفورمر تصویر بهینه از نظر داده (DeiT) 6344 Data-efficient Image Transformer ( DeiT)
۶۳۴۵ ترنسفورمر Swin ترنسفورمر بینایی سلسله‌مراتبی 6345 Swin Transformer Hierarchial Vision Transformer
توضیح مثال کد ۶.۳ بخش ۴ Code Eg 6.3 part 4 Explaination
۶.۴ جاسازی‌های بصری و جستجوی تصویر اهداف یادگیری 6.4 Visual Embeddings and Image Search - Learning Objectives
۶۴۱۱ درک مدل‌های Embedding در بینایی ماشین مولد 6411 Understanding Embedding Models in Generative CV
۶۴۱۲ جاسازی‌های بصری و جستجوی تصویر نقشه تصاویر 6412 Visual Embeddings & Image Search - The Map of Images
۶۴۱۳ از پیکسل‌ها به بردارهای معنایی خط لوله Embedding 6413 From Pixels to Semantic Vectors - The Embedding Pipeline
۶۴۱۴ پیش‌پردازش تصویر در CV مولد تغییر اندازه و نرمال‌سازی 6414 Image Pre-processing in Generative CV Resize & Normalize
۶۴۱۵ نهایی کردن Embedding تصویر و نرمال‌سازی 6415 Finalizing the Embedding - Projection & Normalization
۶۴۱۶ نرمال‌سازی L2 و ارتباط با شباهت کسینوسی 6416 L2 Normalization Resonance with Cosine Similarity
توضیح مثال کد ۶.۴ بخش ۱ Code Eg 6.4 part 1 Explaination
۶۴۲۱ مدل SimCLR یادگیری نمایش‌های بصری از نماهای تقویت شده 6421 SimCLR Learning Visual Repr. From Augmented Views
۶۴۲۲ یادگیری مقابله‌ای با SimCLR 6422 Contrastive Learning with SimCLRTeaching
۶۴۲۳ زیان Triplet در تشخیص چهره 6423 Triplet Loss in Face Recognition
۶۴۲۴ جستجوی بهینه یافتن یک تصویر در میان میلیاردها تصویر 6424 Efficient Search - Finding an Image in Billion-Images
۶۴۲۵ استراتژی‌های ایندکس‌گذاری FAISS 6425 FAISS Indexing strategies
توضیح مثال کد ۶.۴ بخش ۲ Code Eg 6.4 part 2 Explaination
۶۴۳۱ ایندکس فایل معکوس (IVF) برای جستجوی بهینه 6431 Inverted File Index ( IVF ) for Efficient Search
۶۴۳۲ ایندکس کوانتایزاسیون محصول (PQI) برای جستجوی بهینه 6432 Product Quantization Index (PQI) for Efficient Search
۶۴۳۳ مدل HNSW برای جستجوی بهینه 6433 Hierarchical Navigable Small World ( HNSW) for Efficient Search
توضیح مثال کد ۶.۴ بخش ۳ Code Eg 6.4 part 3 Explaination
۶۴۴۱ کاربرد ۱ جستجوی معکوس تصویر 6441 Application 1 Reverse Image Search
۶۴۴۲ تشخیص چهره و ArcFace 6442 Face Recognition & ArcFace
۶۴۴۳ معماری رمزگذار دوگانه CLIP 6443 CLIP Dual-Encoder Architecture
۶۴۴۴ سه کاربرد جستجوی چند-مودال با CLIP 6444 3 Applications of Multimodal search with CLIP
توضیح مثال کد ۶.۴ بخش ۴ Code Eg 6.4 part 4 Explaination

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و هوش مصنوعی مولد (Gen-CV)

جزییات دوره

زمان دوره: 34 hours

تعداد ویدیو ها: 360

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 1,254

امتیاز مرجع: 4.8 از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Vinit Singh

لینک کوتاه این دوره

https://donyad.com/d/e7fa0c

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

بازاریابی

دیگر

آموزش تسلط بر بینایی ماشین: از پیکسل تا تشخیص اشیاء و هوش مصنوعی مولد (Gen-CV) - آخرین آپدیت

دانلود Mastering Computer Vision: From Pixel to Detection to Gen-CV bestseller

مقدمه Introduction

ماژول ۱ مبانی بینایی ماشین و پردازش تصویر Module 1 - Foundations of CV & Image Processing

۱.۱ مقدمه‌ای بر بینایی ماشین اهداف یادگیری 1.1 Introduction to Computer Vision - Learning Objectives

۱.۱.۱ ۱ مقدمه بینایی ماشین 1.1.1-1 Introduction to Computer Vision

۱.۱.۱ ۲ بینایی ماشین چیست؟ 1.1.1-2 What is Computer Vision ?

۱.۱.۱ ۳ شکاف معنایی چالش اصلی بینایی ماشین 1.1.1-3 The Semantic Gap The Core Challenge of CV

توضیح مثال کد ۱.۱.۱ Code Eg 1.1.1 Explaination

۱.۱.۲ ۱ تکامل بینایی ماشین 1.1.2-1 The Evolution of Computer Vision

۱.۱.۲ ۲ تشخیص لبه سوبل (Sobel) 1.1.2-2 Sobel Edge Detection

۱.۱.۲ ۳ تشخیص لبه کنی (Canny) 1.1.2-3 Cannny Edge detection

توضیح مثال کد ۱.۱.۲ Code Eg 1.1.2 Explaination

۱.۱.۳ ۱ استخراج ویژگی‌های HoG 1.1.3-1 Extracting HoG Features

۱.۱.۳ ۲ تشخیص ویژگی‌های SIFT 1.1.3-2 Detect SIFT Features

توضیح مثال کد ۱.۱.۳ Code Eg 1.1.3 Explaination

۱.۱.۴ ۱ طبقه‌بندی‌کننده‌های ML روی ویژگی‌های آموخته شده 1.1.4-1 ML Classifiers on learned Features

۱.۱.۴ ۲ آموزش ماشین‌های بردار پشتیبان (SVM) 1.1.4-2 Train Support Vector Machines (SVM)

۱.۱.۴ ۳ آموزش k-نزدیک‌ترین همسایه (KNN) 1.1.4-3 Train k-Nearest neighbour ( KNN )

توضیح مثال کد ۱.۱.۴ Code Eg 1.1.4 Explaination

۱.۱.۵ ۱ عصر دوم عصر یادگیری عمیق 1.1.5-1 Era 2 - The Deep Learning Era

۱.۱.۵ ۲ عصر هوش مصنوعی مولد 1.1.5-2 The Generative AI Era

۱.۱.۵ ۳ گردش کار جهانی بینایی ماشین 1.1.5-3 The Universal Computer Vision Workflow

توضیح تمرین کد ۱.۱ Code Exercise 1.1 Explaination

۱.۲ مبانی تصویر دیجیتال اهداف یادگیری 1.2 Digital Image Fundamentals - Learning Objectives

۱.۲.۱ ۱ مبانی تصویر دیجیتال 1.2.1-1 Digital Image Fundamentals

۱.۲.۱ ۲ پیکسل اتم بینایی 1.2.1-2 Pixel The Atom of Vision

۱.۲.۱ ۳ تصویر به عنوان ماتریس واقعیت ریاضی 1.2.1-3 Image as Matrix - The Maths Reality

۱.۲.۱ ۴ تصاویر رنگی به عنوان ماتریس‌های سه بعدی 1.2.1-4 Color Images as 3D Matrices

توضیح مثال کد ۱.۲.۱ Code Eg 1.2.1 Explaination

۱.۲.۲ ۱ فضاهای رنگی RGB روش افزودنی 1.2.2-1 Color Spaces RGB The Additive

۱.۲.۲ ۲ فضاهای رنگی HSV تشخیص مقاوم 1.2.2-2 Color Spaces HSV Robust Detection

۱.۲.۲ ۳ فضاهای رنگی Grayscale (سیاه و سفید) 1.2.2-3 Color Spaces Grayscale

توضیح مثال کد ۱.۲.۲ Code Eg 1.2.2 Explaination

۱.۲.۳ عمق تصویر (Bit Depth) 1.2.3 Image Depth (Bit Depth)

توضیح مثال کد ۱.۲.۳ Code Eg 1.2.3 Explaination

۱.۲.۴ کار عملی بینایی ماشین با OpenCV 1.2.4 Hands-On CV with OpenCV

توضیح مثال کد ۱.۲.۴ Code Eg 1.2.4 Explaination

توضیح تمرین کد ۱.۲ Code Exercise 1.2 Explaination

۱.۳ تکنیک‌های ضروری پیش‌پردازش تصویر اهداف یادگیری 1.3 Essential Image Preprocessing Techniques - Learning Objectives

۱.۳.۱ ۱ پیش‌پردازش تصویر 1.3.1-1 Image Preprocessing

۱.۳.۱ ۲ تبدیل تصویر 1.3.1-2 Image Transformation

توضیح مثال کد ۱.۳.۱ Code Eg. 1.3.1 Explaination

۱.۳.۲ ۱ تبدیلات هندسی 1.3.2-1 Geometric Transformations

۱.۳.۲ ۲ تبدیل هندسی ۱ مقیاس‌بندی (Scaling) 1.3.2-2 Geometric Transform 1 - Scaling

۱.۳.۲ ۳ تبدیل هندسی ۲ چرخش و انتقال 1.3.2-3 Geometric Transform 2 - Rotation & Translation

۱.۳.۲ ۴ کار عملی با تبدیلات هندسی OpenCV 1.3.2-4 Hands-On OpenCV Geometric Transformations

توضیح مثال کد ۱.۳.۲ Code Eg. 1.3.2 Explaination

۱.۳.۳ تبدیل هندسی ۳ آفین در مقابل پرسپکتیو 1.3.3 Geometric Transform 3 - Affine vs. Perspective

توضیح مثال کد ۱.۳.۳ Code Eg. 1.3.3 Explaination

۱.۳.۴ ۱ ریاضیات تبدیلات هندسی 1.3.4-1 The Math of Geometric Transformations

۱.۳.۴ ۲ تنظیمات فوتومتریک اصلاح نور و کنتراست 1.3.4-2 Photometric Adjustments Fixing Light & Contrast

۱.۳.۴ ۳ تنظیم فوتومتریک یکسان‌سازی هیستوگرام 1.3.4-3 Photometric Adjustment Histogram Equalization

توضیح مثال کد ۱.۳.۴ Code Eg. 1.3.4 Explaination

۱.۳.۵ ۱ فیلترینگ جادوی کانولوشن 1.3.5-1 Filtering The Magic of Convolution

۱.۳.۵ ۲ کرنل‌ها فیلترهای دست‌ساز برای بینایی 1.3.5-2 The Kernels - Handcrafted Filters for Vision

توضیح مثال کد ۱.۳.۵ Code Eg. 1.3.5 Explaination

۱.۳.۶ کاربردی پیش‌پردازش برای تشخیص چهره 1.3.6 Practical - Preprocessing for Face Recognition

توضیح مثال کد ۱.۳.۶ Code Eg. 1.3.6 Explaination

توضیح تمرین کد ۱.۳ Code Exercise 1.3 Explaination

ماژول ۲: مبانی یادگیری عمیق و شبکه‌های عصبی پیچشی (CNNs) Module 2: Deep Learning Foundations & Convolutional Neural Networks (CNNs)

ماژول ۲ مبانی یادگیری عمیق و شبکه‌های عصبی پیچشی (CNN) مقدمه Module 2 Deep Learning Foundations & Convolutional Neural Networks (CNN) - Intro

۲.۱ از پرسپترون‌ها تا شبکه‌های عصبی عمیق اهداف یادگیری 2.1 From Perceptrons to Deep Neural Networks - Learning Objectives

۲.۱.۱ ۱ تاریخچه بینایی ماشین ۱۹۵۰ تا ۱۹۹۰ 2.1.1-1 Computer Vision History 1950-1990s

۲.۱.۱ ۲ عصر مدرن بینایی ماشین ۱۹۹۰ تا کنون 2.1.1-2 Computer Vision Modern Era 1990s - Present

توضیح مثال کد ۲.۱.۱ Code Eg. 2.1.1 Explaination

۲.۱.۲ ۱ لایه ورودی تا اولین لایه پنهان ریاضیات کامل 2.1.2-1 Input Layer to first hidden layer Complete Maths

۲.۱.۲ ۲ تابع فعال‌ساز 2.1.2-2 Activation Function

۲.۱.۲ ۳ لایه پنهان دوم شبکه عصبی 2.1.2-3 Hidden Layer 2 of Neural Network

۲.۱.۲ ۴ نورون لایه خروجی ریاضیات کامل 2.1.2-4 Output Layer Neuron Complete Maths

۲.۱.۲ ۵ انواع لایه‌ها و نقش آن‌ها 2.1.2-5 Layer Types and Their Roles

توضیح مثال کد ۲.۱.۲ Code Eg. 2.1.2 Explaination

۲.۱.۳ ۱ فرآیند یادگیری دو مرحله‌ای گذر پیشرو (Forward Pass) 2.1.3-1 The two step Learninng Process Forward Pass

۲.۱.۳ ۲ زیان انتروپی متقاطع طبقه‌بندی باینری 2.1.3-2 Cross-Entropy Loss Binary Classification

۲.۱.۳ ۳ زیان انتروپی متقاطع طبقه‌بندی چندکلاسه 2.1.3-3 Cross-Entropy Loss Multi-Class Classification

۲.۱.۳ ۴ گذر پس‌رو (Backward Pass) یادگیری از اشتباهات 2.1.3-4 Backward Pass - Learning from mistakes

۲.۱.۳ ۵ گرادیان نزولی 2.1.3-5 Gradient Descent

توضیح مثال کد ۲.۱.۳ Code Eg. 2.1.3 Explaination