توضیحات دوره:
پیش به سوی بینایی کامپیوتر نسل جدید: YOLOv8، DINO-GPT4V، OpenCV4، تشخیص چهره، هوش مصنوعی مولد، مدلهای انتشار و ترنسفورمرها
یادگیری کامل تئوری و مفاهیم کلیدی بینایی کامپیوتر (بهروز شده در اواخر سال ۲۰۲۳!)
کسب مهارت در استفاده از PyTorch، TensorFlow 2.0 و Keras برای وظایف یادگیری عمیق در بینایی کامپیوتر
YOLOv8: تشخیص اشیاء پیشرفته
DINO-GPT4V: مدلهای بینایی نسل جدید
یادگیری تمامی چارچوبهای مهم تشخیص اشیاء از YOLOv8، R-CNNها، Detectron2، SSDها، EfficientDetect و موارد دیگر!
بخشبندی عمیق با Segment Anything، U-Net، SegNet و DeepLabV3
درک نحوه "دیدن" شبکههای عصبی کانولوشنال (CNN) با تجسم فعالسازیهای مختلف و بهکارگیری GradCAM
شبکههای مولد تخاصمی (GAN) و خودرمزگذارها (Autoencoders) - تولید ارقام، شخصیتهای انیمه، تبدیل سبکها و پیادهسازی وضوح فوقالعاده
آموزش، تنظیم دقیق و تحلیل طبقهبندیکنندههای شخصی شما
تشخیص چهره همراه با تشخیص جنسیت، سن، احساسات و قومیت
انتقال سبک عصبی (Neural Style Transfer) و Google Deep Dream
یادگیری انتقالی (Transfer Learning)، تنظیم دقیق (Fine Tuning) و تکنیکهای پیشرفته CNN
طرحهای مهم CNN مدرن مانند ResNets، InceptionV3، DenseNet، MobileNet، EfficientNet و بسیاری موارد دیگر!
ردیابی با DeepSORT
شبکههای سیامی (Siamese Networks)، تشخیص و تحلیل چهره (سن، جنسیت، احساسات و قومیت)
توضیح تصویر (Image Captioning)، تخمین عمق (Depth Estimation) و ترنسفورمرهای بینایی (Vision Transformers)
طبقهبندی و بخشبندی دادههای سهبعدی (Point Cloud)
ساخت API بینایی کامپیوتر و برنامه وب با استفاده از Flask
OpenCV4 بهطور مفصل، پوشش تمامی مفاهیم کلیدی با کدهای مثال فراوان
تمامی کدهای دوره در نوتبوکهای همراه Google Colab Python کار میکنند
Meta CLIP برای تحلیل پیشرفته تصویر
پیشنیازها:
- بدون نیاز به تجربه برنامهنویسی (کسب تجربه با پایتون مفید خواهد بود)
- ریاضیات پایه دبیرستان
- اتصال اینترنت پرسرعت
به بینایی کامپیوتر مدرن با TensorFlow، Keras و PyTorch خوش آمدید!
هوش مصنوعی و یادگیری عمیق در حال تحول صنایع هستند و یکی از جذابترین بخشهای این انقلاب هوش مصنوعی، در حوزه بینایی کامپیوتر است!
بهروزرسانی برای سال ۲۰۲۴: دوره جامع بینایی کامپیوتر مدرن
- با هیجان آخرین بهروزرسانیها را برای دوره جامع بینایی کامپیوتر مدرن ۲۰۲۴ خود ارائه میدهیم. به یک برنامه درسی غنی شده شیرجه بزنید که پیشرفتهترین و مرتبطترین موضوعات در این زمینه را پوشش میدهد:
- YOLOv8: تشخیص اشیاء پیشرفته
- DINO-GPT4V: مدلهای بینایی نسل جدید
- Meta CLIP برای تحلیل پیشرفته تصویر
- Detectron2 برای تشخیص اشیاء
- Segment Anything
- فناوریهای تشخیص چهره
- شبکههای هوش مصنوعی مولد برای تصویرسازی خلاقانه
- ترنسفورمرها در بینایی کامپیوتر
- استقرار و تولید مدلهای بینایی
- مدلهای انتشار (Diffusion Models) برای پردازش تصویر
- تولید تصویر و کاربردهای آن
- استراتژی حاشیهنویسی (Annotation Strategy) برای یادگیری کارآمد
- تولید تقویتشده بازیابی (RAG)
- طبقهبندیکنندههای بدون شات (Zero-Shot) برای کاربردهای همهکاره
- استفاده از Roboflow: سادهسازی گردش کارهای بینایی
بینایی کامپیوتر چیست؟
اما بینایی کامپیوتر دقیقاً چیست و چرا اینقدر هیجانانگیز است؟ خب، اگر کامپیوترها بتوانند آنچه را که از طریق دوربینها یا تصاویر میبینند، درک کنند چه؟ کاربردهای چنین فناوری بیشمار است از تصویربرداری پزشکی، نظامی، خودروهای خودران، نظارت امنیتی، تحلیل، ایمنی، کشاورزی، صنعت و تولید! لیست بینهایت است.
تقاضا برای کارشناسان بینایی کامپیوتر سر به فلک کشیده است و معمولاً متخصصان این حوزه حقوقهایی بالغ بر ۲۰۰,۰۰۰ دلار آمریکا و بیشتر دریافت میکنند. با این حال، شروع کار در این زمینه آسان نیست. حجم زیادی از اطلاعات وجود دارد که بسیاری از آنها منسوخ شدهاند، و انبوهی از آموزشها که از آموزش مبانی غفلت میکنند. بنابراین، مبتدیان نمیدانند از کجا شروع کنند.
این دوره با هدف حل تمام این مشکلات طراحی شده است!
- آموزش با استفاده از نوتبوکهای Google Colab (بدون نصبهای دردسرساز، همه کدها بلافاصله کار میکنند)
- بیش از ۲۷ ساعت تئوری بهروز و مرتبط بینایی کامپیوتر همراه با کدهای مثال
- آموزش با استفاده از PyTorch و Tensorflow Keras!
در این دوره، مبانی ضروری بینایی کامپیوتر، بینایی کامپیوتر کلاسیک (با استفاده از OpenCV) را یاد خواهید گرفت و سپس به سمت یادگیری عمیق میرویم که در آن دانش پایهای CNNها را میسازیم و همه چیز را در مورد موضوعات زیر یاد میگیریم:
کاربردهای بینایی کامپیوتر با یادگیری عمیق در حال رونق است!
داشتن ماشینهایی که میتوانند ببینند دنیای ما را تغییر خواهد داد و تقریباً هر صنعتی را متحول خواهد کرد. ماشینها یا رباتهایی که میتوانند ببینند قادر خواهند بود:
- جراحی انجام دهند و شما را از طریق اسکنهای پزشکی بهطور دقیق تحلیل و تشخیص دهند.
- خودروهای خودران را فعال کنند.
- رباتها را بهطور ریشهای تغییر دهند و به ما اجازه دهند رباتهایی بسازیم که میتوانند آشپزی کنند، تمیز کنند و تقریباً در هر کاری به ما کمک کنند.
- آنچه در ویدئوهای نظارتی CCTV دیده میشود را درک کنند و بنابراین خدمات امنیتی، مدیریت ترافیک و مجموعهای از خدمات دیگر را انجام دهند.
- با انتقال سبک عصبی شگفتانگیز و انواع دیگر تولید تصویر نوآورانه، هنر خلق کنند.
- وظایف بسیاری مانند شبیهسازی پیری چهرهها، اصلاح فیدهای ویدئویی زنده و جایگزینی واقعی بازیگران در فیلمها را انجام دهند.
راهنمای جامع OpenCV شامل:
- عملیات و دستکاری تصاویر
- کانتورها و بخشبندی
- تشخیص و ردیابی ساده اشیاء
- لندمارکهای چهره، تشخیص چهره و جابجایی چهره (Face Swaps)
- پیادهسازیهای OpenCV از انتقال سبک عصبی، YOLOv3، SSDها و یک رنگکننده تصاویر سیاه و سفید
- کار با ویدئو و استریمهای ویدئویی
سرفصلهای جامع یادگیری عمیق ما شامل:
- طبقهبندی با CNNها
- مرور مفصل تحلیل CNN، تجسم عملکرد، تکنیکهای پیشرفته CNN
- یادگیری انتقالی و تنظیم دقیق
- شبکههای مولد تخاصمی - CycleGAN، ArcaneGAN، SuperResolution، StyleGAN
- خودرمزگذارها
- انتقال سبک عصبی و Google DeepDream
- معماریهای مدرن CNN از جمله ترنسفورمرهای بینایی (ResNets، DenseNets، MobileNET، VGG19، InceptionV3، EfficientNET و ViTs)
- شبکههای سیامی برای شباهت تصویر
- تشخیص چهره (سن، جنسیت، احساسات، قومیت)
- PyTorch Lightning
- تشخیص اشیاء با YOLOv5 و v4، EfficientDetect، SSDها، Faster R-CNNها
- بخشبندی عمیق - MaskCNN، U-NET، SegNET و DeepLabV3
- ردیابی با DeepSORT
- تولید دیپفیک (Deep Fake Generation)
- طبقهبندی ویدئو
- تشخیص نوری کاراکتر (OCR)
- توضیح تصویر (Image Captioning)
- بینایی کامپیوتر سهبعدی با استفاده از دادههای Point Cloud
- تصویربرداری پزشکی - تحلیل اشعه ایکس و اسکنهای CT
- تخمین عمق
- ساخت API بینایی کامپیوتر با Flask
- و موارد بسیار بیشتر
این یک دوره جامع است که به دو بخش اصلی تقسیم شده است. بخش اول یک آموزش مفصل OpenCV (بینایی کامپیوتر کلاسیک) و بخش دوم یک آموزش مفصل یادگیری عمیق است.
این دوره مملو از پروژههای سرگرمکننده و جالب از جمله پروژههای زیر در بینایی کامپیوتر کلاسیک:
- مرتبسازی کانتورها بر اساس اندازه، مکان، استفاده از آنها برای تطبیق شکل
- پیدا کردن والدو
- تبدیلات پرسپکتیو (مانند CamScanner)
- شباهت تصویر
- خوشهبندی K-Means برای رنگهای تصویر
- ردیابی حرکت با MeanShift و CAMShift
- جریان نوری (Optical Flow)
- تشخیص لندمارک چهره با Dlib
- جابجایی چهره (Face Swaps)
- خواندن کدهای QR و بارکد
- حذف پسزمینه
- تشخیص متن
- OCR با PyTesseract و EasyOCR
- رنگآمیزی عکسهای سیاه و سفید
- عکاسی محاسباتی با Inpainting و حذف نویز
- ایجاد طرح (Sketch) از خود با استفاده از تشخیص لبه
- استریمهای RTSP و IP
- ضبط اسکرینشاتها به عنوان ویدئو
- وارد کردن مستقیم ویدئوهای یوتیوب
پروژههای یادگیری عمیق بینایی کامپیوتر:
- آموزش CNN با PyTorch و Keras برای MNIST
- تحلیل طبقهبندیهای اشتباه و عملکرد مدل با PyTorch و Keras
- Fashion-MNIST با PyTorch و Keras با و بدون منظمسازی
- تجسم CNN - تجسم فیلتر و فعالسازی فیلتر
- تجسم CNN - حداکثرسازی فیلتر و کلاس
- تجسم CNN - GradCAM، GradCAM++ و FasterScoreCAM
- بازسازی LeNet و AlexNet در Tensorflow 2.0 با استفاده از Keras
- مدلهای از پیش آموزشدیده PyTorch و Keras - ۱ - VGG16، ResNet، Inceptionv3، MobileNetv2، SqueezeNet، WideResNet، DenseNet201، MobileMNASNet، EfficientNet و MNASNet
- دقت Rank-1 و Rank-5
- پروژه گربهها در مقابل سگها با PyTorch و Keras - آموزش با دادههای خود شما
- آموزش PyTorch Lightning - انتخاب بچ (Batch) و نرخ یادگیری (LR)، Tensorboards، Callbacks، mGPU، TPU و موارد دیگر
- PyTorch Lightning - یادگیری انتقالی
- یادگیری انتقالی و تنظیم دقیق با PyTorch و Keras
- استفاده از CNNها به عنوان استخراجکننده ویژگی با PyTorch و Keras
- Google Deep Dream با PyTorch و Keras
- انتقال سبک عصبی با PyTorch Keras + مدلهای TF-HUB
- خودرمزگذارها با PyTorch و Keras با استفاده از مجموعه داده Fashion-MNIST
- شبکههای مولد تخاصمی (GAN) با PyTorch و Keras - DCGAN - MNIST
- SRGAN وضوح فوقالعاده با Keras
- پروژه - تولید انیمه با StyleGAN
- CycleGAN - تبدیل اسبها به گورخرها
- استنتاج ArcaneGAN
- شبکههای سیامی با PyTorch و Keras
- تشخیص چهره با VGGFace در Keras
- شباهت چهره با FaceNet در PyTorch
- DeepFace - سن، جنسیت، احساسات، زاویه سر و تشخیص چهره
- تشخیص اشیاء - تشخیص اسلحه، تپانچه - Scaled-YOLOv4
- تشخیص اشیاء - تشخیص ماسک - TensorFlow Object Detection - MobileNetV2 SSD
- تشخیص اشیاء - تشخیص زبان اشاره - TFODAPI - EfficientDetD0-D7
- تشخیص اشیاء - تشخیص گودال با TinyYOLOv4
- تشخیص اشیاء - تشخیص نوع قارچ - Detectron 2
- تشخیص اشیاء - تشخیص منطقه اسکرینشات وبسایت - YOLOv4-Darknet
- تشخیص اشیاء - تشخیص دریایی با پهپاد - Tensorflow Object Detection Faster R-CNN
- تشخیص اشیاء - تشخیص مهرههای شطرنج - YOLOv3 PyTorch
- تشخیص اشیاء - تشخیص کلاه ایمنی برای سایتهای ساختمانی - EfficientDet-v2
- تشخیص اشیاء سلولهای خونی با YOLOv5
- تشخیص اشیاء گیاهان با YOLOv5
- بخشبندی تصویر - Keras، U-Net و SegNet
- DeepLabV3 - PyTorch_Vision_Deeplabv3
- دموی Mask R-CNN
- Detectron2 - Mask R-CNN
- آموزش Mask R-CNN - اشکال
- آموزش PyTorch DeepSort با Yolov5
- دیپفیک - اولین مدل اولویت demo
- آموزش ترنسفورمر بینایی PyTorch
- طبقهبندیکننده ترنسفورمر بینایی در Keras
- طبقهبندی تصویر با BigTransfer (BiT)
- تخمین عمق با Keras
- جستجوی شباهت تصویر با یادگیری متریک با Keras
- توضیح تصویر با Keras
- طبقهبندی ویدئو با معماری CNN-RNN با Keras
- طبقهبندی ویدئو با ترنسفورمرها با Keras
- طبقهبندی Point Cloud - PointNet
- بخشبندی Point Cloud با PointNet
- طبقهبندی تصویر سهبعدی CT-Scan
- طبقهبندی ذاتالریه در اشعه ایکس با استفاده از TPUs
- بهبود تصویر در نور کم با MIRNet
- کرکر OCR کپچا
- Flask Rest API - سرور و برنامه وب Flask
- Detectron2 - BodyPose
نمایش نظرات