آموزش بینایی کامپیوتر: OCR با پایتون - GenAI با LLM و RAG - آخرین آپدیت

دانلود Computer Vision : OCR using Python - GenAI with LLM & RAG

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

استاد OCR با پایتون و OpenCV: متخصص بینایی ماشین شوید

قدرت استخراج متن را با هوش مصنوعی و هوش مصنوعی مولد آزاد کنید

تبدیل شدن به متخصص بینایی ماشین و یادگیری OCR با Tesseract، OpenCV، یادگیری عمیق، GenAI، LLMها و RAG

این دوره جامع شما را با مهارت‌های زیر تجهیز می‌کند:

  • ساخت سیستم‌های OCR پیشرفته:

    فراتر از OCR سنتی با پایتون و OpenCV بروید. قدرت مدل‌های زبان بزرگ (LLMs) و تولید افزوده بازیابی (RAG) را برای ایجاد سیستم‌های استخراج متن هوشمند و دقیق بیاموزید.

  • تسلط بر تکنیک‌های یادگیری عمیق:

    مدل‌های یادگیری عمیق پیشرفته مانند CTPN و EAST را برای تشخیص و شناسایی متن فرا بگیرید.

  • ادغام GenAI برای OCR بهبود یافته:

    نحوه ادغام هوش مصنوعی مولد با LLMها و RAG را برای بهبود دقت OCR، استخراج بینش از متن بدون ساختار و خودکارسازی وظایف پیچیده پردازش اسناد کشف کنید.

  • به‌کارگیری OCR در سناریوهای دنیای واقعی:

    پیاده‌سازی راهکارهای OCR برای طیف وسیعی از برنامه‌ها، از جمله دیجیتالی‌سازی اسناد، پردازش فاکتور و موارد دیگر.

  • همگام با پیشرفت‌ها باشید:

    آخرین پیشرفت‌ها در OCR، بینایی ماشین، LLMها، RAG و هوش مصنوعی مولد را دنبال کنید.

ویژگی‌های کلیدی دوره OCR و بینایی ماشین

  • پروژه‌های عملی:

    تجربه عملی با پروژه‌های دنیای واقعی مانند پردازش فاکتور، دیجیتالی‌سازی KYC و تشخیص کارت ویزیت به دست آورید.

  • راهنمایی تخصصی:

    از مدرسان باتجربه بیاموزید که شما را در هر مرحله از فرآیند راهنمایی می‌کنند.

  • پوشش جامع:

    طیف وسیعی از موضوعات را از پردازش پایه تصویر و یادگیری عمیق تا تکنیک‌های پیشرفته LLM و RAG کاوش کنید.

  • پشتیبانی اختصاصی:

    پشتیبانی ۲۴/۷ از تیم متخصصان ما دریافت کنید.

  • یادگیری انعطاف‌پذیر:

    با ویدیوهای آموزشی خودگام و منابع قابل دانلود، با سرعت خودتان یاد بگیرید.

آنچه خواهید آموخت:

  • پردازش پایه تصویر:

    مبانی پردازش تصویر، از جمله فرمت‌های تصویر، فضاهای رنگی و تکنیک‌های دستکاری تصویر را درک کنید.

  • تشخیص و شناسایی متن:

    تکنیک‌های تشخیص و شناسایی متن در تصاویر و PDFها را فرا بگیرید.

  • یادگیری عمیق برای OCR:

    مدل‌های یادگیری عمیق پیشرفته مانند CTPN و EAST را برای تشخیص و شناسایی دقیق متن کشف کنید.

  • انقلاب در OCR با قدرت LLMها و RAG:

    با تسلط بر تنظیم دقیق LLM، کاوش در معماری‌های RAG و ادغام بی‌درز خروجی‌های OCR در خطوط لوله پیشرفته هوش مصنوعی، سیستم‌های استخراج متن هوشمند بسازید.

  • پیش‌پردازش و افزایش داده:

    داده‌های خود را برای آموزش مدل‌های یادگیری عمیق آماده کنید.

  • آموزش و ارزیابی مدل:

    مدل‌های خود را با استفاده از معیارهای مناسب آموزش داده و ارزیابی کنید.

  • استراتژی‌های پیاده‌سازی:

    مدل‌های OCR خود را در محیط‌های تولید پیاده‌سازی کنید.

چرا این دوره را انتخاب کنید؟

  • مهارت‌های مرتبط با صنعت:

    مهارت‌های پرتقاضا در OCR، بینایی ماشین، LLMها، RAG و هوش مصنوعی مولد را برای پیشرفت شغلی خود در هوش مصنوعی و یادگیری ماشین توسعه دهید.

  • کاربردهای دنیای واقعی:

    بیاموزید چگونه OCR را برای حل مشکلات دنیای واقعی به کار ببرید.

  • یادگیری انعطاف‌پذیر:

    با ویدیوهای آموزشی خودگام و منابع قابل دانلود، با سرعت خودتان یاد بگیرید.

  • راهنمایی تخصصی:

    از آموزش تخصصی و پشتیبانی شخصی‌سازی‌شده بهره‌مند شوید.

  • پیشرفت شغلی:

    با مهارت‌های پیشرفته OCR، مزیت رقابتی در بازار کار کسب کنید.

اکنون ثبت‌نام کنید و قدرت OCR را با GenAI، LLMها و RAG آزاد کنید!

مقدمه‌ای سریع بر معماری OCR، راهکارهای تجاری و موارد استفاده در صنعت

یادگیری پیاده‌سازی OCR - تشخیص متن با OpenCV و مدل‌های یادگیری عمیق

استفاده از Tesseract و EasyOCR برای پیاده‌سازی OCR - تشخیص متن

کار با OCR - برچسب‌گذاری متن با Spacy و عبارت منظم

کشف مفاهیم RAG، معماری آن و استخراج بینش‌های عمیق‌تر از متن

ادغام خروجی‌های OCR در خطوط لوله RAG برای درک پیشرفته اسناد و استخراج اطلاعات

ساخت راهکارهای OCR برای پردازش فاکتور با برچسب‌گذاری متن و خروجی XML و تشخیص پلاک خودرو

کد اجرایی پیاده‌سازی مدل CTPN و EAST برای تشخیص متن و شناسایی متن

یادگیری آموزش مدل‌های یادگیری عمیق CTPN و EAST بر روی مجموعه داده ICDAR

درک مبانی تصویر و به‌کارگیری آن برای پردازش تصویر

استفاده از OpenCV و Tesseract برای اعمال تکنیک‌های حذف نویز از جمله آستانه‌گذاری، تغییر مقیاس، انبساط، فرسایش و رفع انحراف

یادگیری توسعه برنامه‌های مبتنی بر وب - تشخیص کارت ویزیت و دیجیتالی‌سازی KYC برای OCR با استفاده از Flask


سرفصل ها و درس ها

شروع دوره Course Starter

  • مسیر یادگیری برای متخصص بینایی کامپیوتر شدن Learning Path to Become Computer Vision Expert

  • شروع دوره - نحوه رویکرد به دوره Course Starter - How to approach the course

  • بررسی Udemy Udemy Review

OCR Starter - معماری OCR OCR Starter - OCR Architecture

  • اهداف Objectives

  • مرور OCR OCR Overview

  • معماری OCR OCR Architecture

  • راهکارهای OCR OCR Solutions

  • مزایای OCR OCR Benefits

  • مورد استفاده OCR در صنایع مختلف OCR Use Case Across Industry

  • آزمون شروع OCR OCR Starter Quiz

راه‌اندازی محیط - Ubuntu, Windows Setting up Environment - Ubuntu, Windows

  • اهداف Objectives

  • راه‌اندازی ابزار - Ubuntu Tool Setup - Ubuntu

  • راه‌اندازی ابزار - Windows Tool Setup - Windows

  • رفع مشکلات راه‌اندازی Setup Issues Resolution

  • استفاده از Google Colab Using Google Colab

  • استفاده از Pycharm برای کدنویسی Using Pycharm for Coding

  • استفاده از Jupyter Notebook و میانبرها Using Jupyter Notebook and Shortcuts

  • آزمون راه‌اندازی محیط Setting up Environment Quiz

مبانی تصویر - پیکسل‌ها، کرنل، ویژگی‌های تصویر Image Basics - Pixels, Kernel, Image Properties

  • اهداف Objectives

  • پیکسل‌ها و تصاویر Pixels and Images

  • ویژگی‌های تصویر با استفاده از OpenCV و PIL Image Properties using OpenCV and PIL

  • نگاشت ویژگی با استفاده از کرنل Feature Mapping using Kernel

  • نقشه ویژگی Feature Map

  • آزمون مبانی تصویر Image Basics Quiz

تشخیص متن - تکنیک‌های یادگیری ماشین (حذف نویز، آستانه‌گذاری) Text Detection - Machine Learning Techniques (Noise Removal, Thresholding)

  • اهداف Objectives

  • گردش کار تشخیص متن Text Detection Workflow

  • پیش‌پردازش برای بهبود دقت Preprocessing for Accuracy Improvement

  • تکنیک‌های حذف نویز (مورفولوژی، تاری تصویر، انبساط، فرسایش، تصحیح انحراف) Noise Removal Techniques (Morphology, Image Blurring, Dilation, Erosion, Deskew)

  • پیاده‌سازی تکنیک‌های پیش‌پردازش (آستانه‌گذاری تطبیقی، Otsu، تاری گوسی) Implement Preprocessing Techniques (Adaptive, Otsu Binarisation, Gaussian Blur)

  • بخش‌بندی متن تصویر Segmentation of Image Text

  • پیاده‌سازی بخش‌بندی (سطح خط، کلمه و کاراکتر) Implement Segmentation (Line, Word and Character Level Segmentation)

کاوش ابزارهای OCR منبع باز - Tesseract, Calamari و OCRopus Exploring Open-Source OCR Tools - Tesseract, Calamari and OCRopus

  • اهداف Objectives

  • نیاز به OCR The Need for OCR

  • مزایای OCR رایگان و منبع باز Benefits of Free and Open Source OCR

  • Tesseract - موتور OCR منبع باز قوی Tesseract - The Robust Open-Source OCR Engine

  • Calamari - ابزار OCR مبتنی بر یادگیری عمیق Calamari - A Deep Learning Based OCR Tool

  • OCRopus - نگاهی عمیق به OCR منبع باز OCRopus - A Deep Dive into Open Source OCR

  • مقایسه ابزارهای OCR منبع باز Comparison of Open-Source OCR Tools

  • منابع Resources

ابزارهای Cloud Vision - Abbyy Cloud, Google Cloud و Azure Computer Vision Cloud Vision Tools - Abbyy Cloud, Google Cloud and Azure Computer Vision

  • اهداف Objectives

  • ظهور بینایی کامپیوتر مبتنی بر ابر The Rise of Cloud-Based Computer Vision

  • معرفی Abbyy Cloud Introducing Abbyy Cloud

  • ویژگی‌های کلیدی Abbyy Cloud Key Features of Abbyy Cloud

  • معرفی Google Cloud Vision Unveiling Google Cloud Vision

  • کاوش Azure Computer Vision Exploring Azure Computer Vision

  • قدرت Azure Computer Vision The Power of Azure Computer Vision

  • انتخاب ابزار Cloud Vision مناسب Choosing the Right Cloud Vision Tool

  • موارد استفاده و کاربردهای Cloud Vision Cloud Vision Use Cases and Applications

  • آینده Cloud Vision The Future of Cloud Vision

  • مطالعات موردی Cloud Vision Case Studies of Cloud Vision

استفاده از OCR برای RAG - خط لوله LLM Using OCR for RAG - LLM Pipeline

  • اهداف Objectives

  • مقدمه‌ای بر LLM Introduction to LLM

  • چگونه یک برنامه LLM را سفارشی کنیم؟ How to customize an LLM application ?

  • چه چالشی را RAG حل می‌کند؟ What challenge does RAG solve ?

  • مقدمه‌ای بر RAG Introduction to RAG

  • معماری RAG RAG Architecture

  • نمایه‌سازی Indexing

  • بازیاب و مولد Retriever and Generator

  • بهترین چارچوب‌ها برای پیاده‌سازی مدل RAG Best Frameworks for implementing RAG Model

  • مزایای RAG Benefits of RAG

  • ادغام OCR در خط لوله RAG Integrating OCR into RAG Pipeline

  • پروژه ۱ - بررسی کد - نحوه ساخت خط لوله RAG خود با Mistral Project 1 - Code Walkthrough - How to build your own RAG Pipeline with Mistral

مقدمه‌ای بر شبکه‌های عصبی و مدل‌های تشخیص متن Introduction to Neural Networks and Text Detection Models

  • اهداف Objectives

  • نورون چیست؟ What is a Neuron?

  • معماری نورون Neuron Architecture

  • شبکه عصبی مصنوعی Artificial Neural Network

  • شبکه عصبی کانولوشنال Convolutional Neural Network

  • تابع فعال‌سازی Activation Function

  • یادگیری عمیق - مدل CTPN Deep Learning - CTPN Model

  • یادگیری عمیق - مدل EAST Deep Learning - EAST Model

  • حاشیه‌نویسی برای OCR Annotation for OCR

  • مطالعه بیشتر - ابزارهای تشخیص متن منبع باز Further Reading - Open Source Text Detection Tools

تشخیص و بازشناسی متن - EasyOCR, Tesseract, PyTesseract Text Detection & Recognition - EasyOCR, Tesseract, PyTesseract

  • اهداف Objectives

  • EasyOCR EasyOCR

  • پیاده‌سازی EasyOCR EasyOCR Implementation

  • Tesseract Tesseract

  • حالت‌های PSM و OEM در Tesseract Tesseract PSM and OEM Mode

  • عملیات PyTesseract PyTesseract Operations

  • پیاده‌سازی Tesseract Tesseract Implementation

  • مطالعه بیشتر - ابزارهای بازشناسی متن منبع باز Further Reading - Open Source Text Recognition Tools

  • آزمون بازشناسی متن Text Recognition Quiz

بایگانی - تشخیص متن - تکنیک‌های یادگیری عمیق (CTPN, EAST) Archive - Text Detection - Deep Learning Techniques (CTPN, EAST)

  • راهنمای نصب برای اجرای کد تشخیص متن در ویندوز (CTPN, EAST) Installation Guide for Running Text Detection Code on Windows (CTPN, EAST)

  • راهنمای نصب برای اجرای کد تشخیص متن در اوبونتو (CTPN, EAST) Installation Guide for Running Text Detection Code on Ubuntu (CTPN, EAST)

  • بررسی کد - پیاده‌سازی CTPN برای تشخیص متن Code Walkthrough - CTPN Implementation for Text Detection

  • دانلود کد - پیاده‌سازی CTPN برای تشخیص متن Code Download - CTPN Implementation for Text Detection

  • تشخیص متن CTPN در Google Colab CTPN Text Detection on Google Colab

  • آموزش CTPN با استفاده از مجموعه داده ICDAR SIROE CTPN Training using ICDAR SIROE Dataset

  • بررسی کد - پیاده‌سازی EAST برای تشخیص متن Code Walkthrough - EAST Implementation for Text Detection

  • دستورالعمل‌های کامپایل کد برای EAST در ویندوز Code Compilation Guidelines for EAST on Windows

  • دانلود کد - پیاده‌سازی EAST برای تشخیص متن Code Download - EAST Implementation for Text Detection

  • تشخیص متن EAST در Google Colab EAST Text Detection on Google Colab

  • آموزش EAST با استفاده از مجموعه داده ICDAR SIROE EAST Training using ICDAR SIROE Dataset

  • آزمون تشخیص متن Text Detection Quiz

بایگانی - بازشناسی متن - تکنیک‌های یادگیری عمیق (CTPN, EAST) Archive - Text Recognition - Deep Learning Techniques (CTPN, EAST)

  • راهنمای نصب برای اجرای کد بازشناسی متن در ویندوز (CTPN, EAST) Installation Guide for Running Text Recognition Code on Windows (CTPN, EAST)

  • راهنمای نصب برای اجرای کد بازشناسی متن در اوبونتو (CTPN, EAST) Installation Guide for Running Text Recognition Code on Ubuntu (CTPN, EAST)

  • بررسی کد - پیاده‌سازی CTPN برای بازشناسی متن Code Walkthrough - CTPN Implementation for Text Recognition

  • دانلود کد - پیاده‌سازی CTPN برای بازشناسی متن Code Download - CTPN Implementation for Text Recognition

  • بازشناسی متن CTPN در Google Colab CTPN Text Recognition on Google Colab

  • بررسی کد - پیاده‌سازی EAST برای بازشناسی متن Code Walkthrough - EAST Implementation for Text Recognition

  • دستورالعمل‌های کامپایل کد برای EAST در ویندوز Code Compilation Guidelines for EAST on Windows

  • دانلود کد - پیاده‌سازی EAST برای بازشناسی متن Code Download - EAST Implementation for Text Recognition

  • بازشناسی متن EAST در Google Colab EAST Text Recognition on Google Colab

پردازش زبان طبیعی با RegEx، Spacy و OCR Natural Language Processing with RegEx, Spacy & OCR

  • اهداف Objectives

  • تشخیص موجودیت نامدار Named Entity Recognition

  • Spacy Spacy

  • Spacy برای تشخیص موجودیت نامدار و بخش‌بندی گفتار Spacy for Named Entity Recognition and Part-Of-Speech

  • عبارات باقاعده برای برچسب‌گذاری متن Regular Expression for Text Labelling

  • عبارات باقاعده برای تاریخ‌ها Regular Expression for Dates

  • پیاده‌سازی عبارات باقاعده Regular Expression Implementation

  • آزمون برچسب‌گذاری متن Text Labelling Quiz

OCR پیشرفته با بررسی کد با استفاده از ۵ پروژه زنده Advance OCR with code walkthrough using 5 Live Projects

  • پروژه ۲ - تشخیص پلاک خودرو - نمای کلی پروژه Project 2 - Number Plate Recognition - Project Overview

  • پروژه ۲ - تشخیص پلاک خودرو - بررسی کد Project 2 - Number Plate Recognition - Code Walkthrough

  • پروژه ۲ - تشخیص پلاک خودرو - دستورالعمل دانلود کد Project 2 - Number Plate Recognition - Code Download Instructions

  • پروژه ۳ - پردازش فاکتور با برچسب‌گذاری متن - نمای کلی پروژه Project 3 - Invoice Processing with Text Labelling - Project Overview

  • پروژه ۳ - پردازش فاکتور با برچسب‌گذاری متن - بررسی کد Project 3 - Invoice Processing with Text Labelling - Code Walkthrough

  • پروژه ۳ - پردازش فاکتور با برچسب‌گذاری متن - دستورالعمل دانلود کد Project 3 - Invoice Processing with Text Labelling - Code Download Instructions

  • پروژه ۴ - پردازش فاکتور با خروجی XML - نمای کلی پروژه Project 4 - Invoice Processing with XML Output - Project Overview

  • پروژه ۴ - پردازش فاکتور با خروجی XML - بررسی کد Project 4 - Invoice Processing with XML Output - Code Walkthrough

  • پروژه ۴ - پردازش فاکتور با خروجی XML - دستورالعمل دانلود کد Project 4 - Invoice Processing with XML Output - Code Download Instructions

  • پروژه ۵ - تشخیص کارت ویزیت - نمای کلی پروژه Project 5 - Business Card Recognition - Project Overview

  • پروژه ۵ - تشخیص کارت ویزیت - بررسی کد Project 5 - Business Card Recognition - Code Walkthrough

  • پروژه ۵ - تشخیص کارت ویزیت - دستورالعمل دانلود کد Project 5 - Business Card Recognition - Code Download Instructions

  • بایگانی - پروژه ۶ - دیجیتالی کردن KYC - نمای کلی پروژه Archive - Project 6 - KYC Digitization - Project Overview

  • راهنمای نصب برای اجرای پروژه با استفاده از CTPN در ویندوز Installation Guide for Running the Project using CTPN on Windows

  • راهنمای نصب برای اجرای پروژه با استفاده از CTPN در اوبونتو Installation Guide for Running the Project using CTPN on Ubuntu

  • بایگانی - پروژه ۶ - دیجیتالی کردن KYC - بررسی کد Archive - Project 6 - KYC Digitization - Code Walkthrough

  • بایگانی - پروژه ۶ - دیجیتالی کردن KYC - دستورالعمل دانلود کد Archive - Project 6 - KYC Digitization - Code Download Instructions

نمایش نظرات

آموزش بینایی کامپیوتر: OCR با پایتون - GenAI با LLM و RAG
جزییات دوره
8.5 hours
121
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
1,292
4 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Vineeta Vashistha Vineeta Vashistha

معمار هوش مصنوعی