دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش تشخیص کاراکتر نوری (OCR) در پایتون

Optical Character Recognition (OCR) in Python bestseller

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: OpenCV، Tesseract، EasyOCR و EAST روی تصاویر و ویدیوها اعمال می شوند! OCR خود را از ابتدا با استفاده از یادگیری عمیق ایجاد کنید! استفاده از ابزارهای Tesseract، EAST و EasyOCR برای تشخیص متن در تصاویر و ویدئوها درک تفاوت‌های بین OCR در محیط‌های کنترل‌شده و طبیعی استفاده از تکنیک‌های پیش پردازش تصویر برای بهبود کیفیت تصویر، مانند: آستانه‌گذاری، وارونگی، تغییر اندازه، عملیات مورفولوژیکی و کاهش نویز استفاده کنید. معماری EAST و کتابخانه EasyOCR برای عملکرد بهتر در صحنه‌های طبیعی آموزش یک OCR از ابتدا با استفاده از یادگیری عمیق و شبکه‌های عصبی کانولوشنال استفاده از تکنیک‌های پردازش زبان طبیعی در متون استخراج‌شده توسط OCR (کلمه واژه و شناسایی موجودیت نام‌دار) پلاک‌خوانی پیش نیازها:برنامه‌نویسی اصول برنامه نویسی پایتون منطقی

در ناحیه دید کامپیوتر، زیر ناحیه تشخیص کاراکتر نوری (OCR) قرار دارد که هدف آن تبدیل تصاویر به متن است. OCR را می توان به عنوان تبدیل تصاویر حاوی متن تایپ شده، دست نویس یا چاپ شده به کاراکترهایی که ماشین می تواند درک کند، توصیف کرد. امکان تبدیل اسناد اسکن شده یا عکس گرفته شده به متون قابل ویرایش در هر ابزاری مانند Microsoft Word وجود دارد. یک برنامه رایج، خواندن خودکار فرم است که در آن می توانید عکس کارت اعتباری یا گواهینامه رانندگی خود را ارسال کنید و سیستم می تواند تمام داده های شما را بدون نیاز به تایپ دستی بخواند. یک ماشین خودران می تواند از OCR برای خواندن علائم راهنمایی و رانندگی استفاده کند و یک پارکینگ می تواند با خواندن پلاک خودروها دسترسی را تضمین کند!

برای اینکه شما را به این منطقه ببریم، در این دوره به صورت عملی یاد می گیرید که چگونه از کتابخانه های OCR برای تشخیص متن در تصاویر و ویدیوها استفاده کنید، تمام کدهایی که گام به گام با استفاده از زبان برنامه نویسی پایتون پیاده سازی شده اند! ما قصد داریم از Google Colab استفاده کنیم، بنابراین لازم نیست نگران نصب کتابخانه ها بر روی دستگاه خود باشید، زیرا همه چیز به صورت آنلاین با استفاده از GPU های Google توسعه می یابد! همچنین یاد خواهید گرفت که چگونه با استفاده از یادگیری عمیق و شبکه های عصبی کانولوشنال OCR خود را از ابتدا بسازید! در زیر می توانید سرفصل های اصلی دوره را بررسی کنید:

تشخیص متون در تصاویر و ویدئوها با استفاده از Tesseract، EasyOCR و EAST
عبارات خاص را در تصاویر با استفاده از عبارات منظم جستجو کنید
تکنیک‌هایی برای بهبود کیفیت تصویر، مانند: آستانه‌گذاری، وارونگی رنگ، مقیاس خاکستری، تغییر اندازه، حذف نویز، عملیات مورفولوژیکی و تبدیل پرسپکتیو
معماری EAST و کتابخانه EasyOCR برای عملکرد بهتر در صحنه‌های طبیعی
آموزش OCR از ابتدا با استفاده از TensorFlow و تکنیک های مدرن یادگیری عمیق، مانند شبکه های عصبی کانولوشن
کاربرد تکنیک‌های پردازش زبان طبیعی در متون استخراج‌شده توسط OCR (کلمه واژه و شناسایی موجودیت نام‌دار)
خواندن پلاک گواهینامه

اینها فقط برخی از موضوعات اصلی هستند! در پایان دوره، همه چیزهایی را که برای ایجاد پروژه های تشخیص متن خود با استفاده از OCR نیاز دارید، خواهید دانست!

سرفصل ها و درس ها

معرفی Introduction

محتوای دوره Course content
مقدمه ای بر OCR Introduction to OCR
مواد درسی Course materials

OCR با Tesseract OCR with Tesseract

مقدمه ای بر Tesseract Introduction to Tesseract
آماده سازی محیط Preparing the environment
اولین تشخیص متن First text recognition
پشتیبانی از زبان های دیگر Support for other languages
حالت تقسیم بندی صفحه (PSM) Page segmentation mode (PSM)
تشخیص جهت صفحه Page orientation detection
انتخاب متون 1 Selection of texts 1
انتخاب متون 2 Selection of texts 2
انتخاب متون 3 Selection of texts 3
جستجو با استفاده از عبارات منظم Search using regular expressions
تشخیص در سناریوهای طبیعی Detections in natural scenarios

تکنیک های پیش پردازش تصویر Techniques for image pre-processing

مقیاس خاکستری Grayscale
آستانه - شهود Thresholding - intuition
آستانه گذاری ساده Simple thresholding
آستانه گذاری با روش اوتسو Thresholding with Otsu method
آستانه تطبیقی Adaptive thresholding
آستانه تطبیقی گاوسی Gaussian adaptive thresholding
وارونگی رنگ Color inversion
تغییر اندازه - شهود Resizing - intuition
تغییر اندازه - پیاده سازی Resizing - implementation
عملیات مورفولوژیکی - شهود Morphological operations - intuition
عملیات ریخت شناسی - اجرا Morphological operations - implementation
حذف نویز - شهود Noise removal - intuition
حذف نویز - اجرا Noise removal - implementation
تشخیص متن با OCR Text recognition with OCR
مشق شب HOMEWORK
راه حل تکلیف Homework solution

OCR با EAST برای صحنه های طبیعی OCR with EAST for natural scenes

شرق - مقدمه EAST - introduction
پیش پردازش تصویر Pre-processing the image
بارگذاری شبکه عصبی Loading the neural network
رمزگشایی تصویر 1 Decoding the image 1
رمزگشایی تصویر 2 Decoding the image 2
تشخیص متن Text recognition

آموزش OCR سفارشی Training a custom OCR

واردات کتابخانه ها Importing the libraries
مجموعه داده MNIST 0-9 MNIST 0-9 dataset
مجموعه داده Kaggle A-Z Kaggle A-Z dataset
پیوستن به مجموعه داده ها Joining the datasets
پیش پردازش داده ها Pre-processing the data
ساخت شبکه عصبی Building the neural network
آموزش شبکه عصبی Training the neural network
ارزیابی شبکه عصبی Evaluating the neural network
صرفه جویی در شبکه عصبی Saving the neural network
تست با تصاویر Testing with images
آماده سازی محیط Preparing the environment
پیش پردازش تصویر Pre-processing the image
تشخیص کانتور Contour detection
پردازش تشخیص ها 1 Processing the detections 1
پردازش تشخیص ها 2 Processing the detections 2
شخصیت شناسی Character recognition
مشکلات 0 و O، 1 و l، 5 و S Problems with 0 and O, 1 and l, 5 and S
مشکلات مربوط به متون شناسایی نشده Problems with undetected texts

سناریوهای طبیعی با EasyOCR Natural scenarios with EasyOCR

آماده سازی محیط Preparing the environment
تشخیص متن Text recognition
نوشتن نتایج روی تصویر Writing the results on the image
زبان های دیگر - فرانسوی و چینی Other languages - French and Chinese
تشخیص متن (پس زمینه) Text recognition (background)

OCR در ویدیوها OCR in videos

آماده سازی محیط Preparing the environment
تنظیمات ویدیو Video settings
در حال پردازش ویدیو Processing the video
OCR با EAST و Tesseract OCR with EAST and Tesseract
OCR با EasyOCR OCR with EasyOCR

پروژه 1: جستجوی عبارات خاص Project 1: Searching for specific terms

آماده سازی محیط Preparing the environment
تشخیص متن Text recognition
جستجوی متون Searching for texts
ابر کلمه Word cloud
شناسایی موجودیت نامگذاری شده Named entity recognition
جستجوی متون در تصاویر Search for texts in images
ذخیره نتایج Saving the results

پروژه 2: اسکنر + OCR Project 2: Scanner + OCR

آماده سازی محیط Preparing the environment
تشخیص کانتور Contour detection
دگرگونی چشم انداز Perspective transformation
OCR با Tesseract OCR with Tesseract
بهبود کیفیت تصویر Improving image quality
همه را کنار هم گذاشتن Putting all together

پروژه 3: پلاک خوانی Project 3: License plate reading

پیش پردازش تصویر Pre-processing the image
تشخیص متن Text recognition
بهبود کیفیت تصویر Improving image quality

محتوای اضافی 1: شبکه های عصبی مصنوعی Extra content 1: artificial neural networks

مبانی بیولوژیکی Biological fundamentals
پرسپترون تک لایه Single layer perceptron
پرسپترون چند لایه - توابع مجموع و فعال سازی Multilayer perceptron – sum and activation functions
پرسپترون چند لایه - محاسبه خطا Multilayer perceptron – error calculation
نزول گرادیان Gradient descent
پارامتر دلتا Delta parameter
به روز رسانی وزنه ها با پس انتشار Updating weights with backpropagation
تعصب، خطا، نزول گرادیان تصادفی، و پارامترهای بیشتر Bias, error, stochastic gradient descent, and more parameters

محتوای اضافی 2: شبکه های عصبی کانولوشنال Extra content 2: convolutional neural networks

مقدمه ای بر شبکه های عصبی کانولوشنال Introduction to convolutional neural networks
عملیات کانولوشن Convolutional operation
ادغام Pooling
صاف کردن Flattening
شبکه عصبی متراکم Dense neural network

اظهارات پایانی Final remarks

اظهارات پایانی Final remarks
جایزه BONUS

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش تشخیص کاراکتر نوری (OCR) در پایتون

جزییات دوره

زمان دوره: 13 hours

تعداد ویدیو ها: 95

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 1,820

امتیاز مرجع: 4.5 از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Jones Granatyr Gabriel Alves AI Expert Academy

لینک کوتاه این دوره

https://donyad.com/d/a28d12

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jones Granatyr

استاد اولا! 10 مورد از جونز گراناتیر و ترابیلو در 10 سال گذشته است که شامل Inteligência Artificial (IA) می باشد استاد حرفه ای ، پشکیزادور و بنیانگذار پورتال IA Expert ، وب سایت com conteúdo específico sobre Inteligência Artificial. Desde que iniciei na Udemy criei vários cursos sobre diversos assuntos de IA، como as exemplolo: یادگیری عمیق ، یادگیری ماشین ، علم داده ، Redes Neurais Artificiais، Algoritmos Genéticos، Detecção e Reconhecimento Facial، Algoritmos de cesos، Busca ، Mineração de Regras de Associação ، Sistemas Especialistas e Sistemas de Recomendação. اگر بخواهید از طریق برنامه های مختلف زبان (Python ، R e Java) و یا فن آوری های مختلف (tensorflow ، keras ، pandas ، sklearn ، opencv ، dlib ، weka ، nltk ، به عنوان مثال) استفاده کنید. با توجه به هدف اصلی و دستیابی به اطلاعات IA و مجوز فعالیت در TI و متقاضیان ، به عنوان تجدید نظر در زمینه استفاده از قوانین و مقررات و امکان مشاهده تجدید نظرهای جدید در زمینه مشروبات الکلی ارائه می شود.

Gabriel Alves

توسعه دهنده Olá ، eu me chamo گابریل آلوس و به صورت رسمی در قالب Cienscia da Computação pela Universidade do Contestado (UnC) Porto União. Curso Técnico em Informática pelo Colégio Técnico de União da Vitória (COLTEC) ، نتیجه گیری در سال 2014. ما با استفاده از زبانهای ویژه و ویژه زبانهای پایتون ، با کیفیت مناسب ترجیح می دهیم که از هیچ یک از مصالح مصنوعی Inteligência استفاده نکنید. Sou desde semper apaixonado pela computação e por temas que envolvem ciência e tecnologia.

AI Expert Academy

مربی

دنیاد

آموزش تشخیص کاراکتر نوری (OCR) در پایتون

Optical Character Recognition (OCR) in Python bestseller

معرفی Introduction

محتوای دوره Course content

مقدمه ای بر OCR Introduction to OCR

مواد درسی Course materials

OCR با Tesseract OCR with Tesseract

مقدمه ای بر Tesseract Introduction to Tesseract

آماده سازی محیط Preparing the environment

اولین تشخیص متن First text recognition

پشتیبانی از زبان های دیگر Support for other languages

حالت تقسیم بندی صفحه (PSM) Page segmentation mode (PSM)

تشخیص جهت صفحه Page orientation detection

انتخاب متون 1 Selection of texts 1

انتخاب متون 2 Selection of texts 2

انتخاب متون 3 Selection of texts 3

جستجو با استفاده از عبارات منظم Search using regular expressions

تشخیص در سناریوهای طبیعی Detections in natural scenarios

تکنیک های پیش پردازش تصویر Techniques for image pre-processing

مقیاس خاکستری Grayscale

آستانه - شهود Thresholding - intuition

آستانه گذاری ساده Simple thresholding

آستانه گذاری با روش اوتسو Thresholding with Otsu method

آستانه تطبیقی Adaptive thresholding

آستانه تطبیقی ​​گاوسی Gaussian adaptive thresholding

وارونگی رنگ Color inversion

تغییر اندازه - شهود Resizing - intuition

تغییر اندازه - پیاده سازی Resizing - implementation

عملیات مورفولوژیکی - شهود Morphological operations - intuition

عملیات ریخت شناسی - اجرا Morphological operations - implementation

حذف نویز - شهود Noise removal - intuition

حذف نویز - اجرا Noise removal - implementation

تشخیص متن با OCR Text recognition with OCR

مشق شب HOMEWORK

راه حل تکلیف Homework solution

OCR با EAST برای صحنه های طبیعی OCR with EAST for natural scenes

شرق - مقدمه EAST - introduction

پیش پردازش تصویر Pre-processing the image

بارگذاری شبکه عصبی Loading the neural network

رمزگشایی تصویر 1 Decoding the image 1

رمزگشایی تصویر 2 Decoding the image 2

تشخیص متن Text recognition

آموزش OCR سفارشی Training a custom OCR

واردات کتابخانه ها Importing the libraries

مجموعه داده MNIST 0-9 MNIST 0-9 dataset

مجموعه داده Kaggle A-Z Kaggle A-Z dataset

پیوستن به مجموعه داده ها Joining the datasets

پیش پردازش داده ها Pre-processing the data

ساخت شبکه عصبی Building the neural network

آموزش شبکه عصبی Training the neural network

ارزیابی شبکه عصبی Evaluating the neural network

صرفه جویی در شبکه عصبی Saving the neural network

تست با تصاویر Testing with images

آماده سازی محیط Preparing the environment

پیش پردازش تصویر Pre-processing the image

تشخیص کانتور Contour detection

پردازش تشخیص ها 1 Processing the detections 1

پردازش تشخیص ها 2 Processing the detections 2

شخصیت شناسی Character recognition

مشکلات 0 و O، 1 و l، 5 و S Problems with 0 and O, 1 and l, 5 and S

مشکلات مربوط به متون شناسایی نشده Problems with undetected texts

سناریوهای طبیعی با EasyOCR Natural scenarios with EasyOCR

آماده سازی محیط Preparing the environment

تشخیص متن Text recognition

نوشتن نتایج روی تصویر Writing the results on the image

زبان های دیگر - فرانسوی و چینی Other languages - French and Chinese

تشخیص متن (پس زمینه) Text recognition (background)

OCR در ویدیوها OCR in videos

آماده سازی محیط Preparing the environment

تنظیمات ویدیو Video settings

در حال پردازش ویدیو Processing the video

OCR با EAST و Tesseract OCR with EAST and Tesseract

OCR با EasyOCR OCR with EasyOCR

پروژه 1: جستجوی عبارات خاص Project 1: Searching for specific terms

آماده سازی محیط Preparing the environment

تشخیص متن Text recognition

جستجوی متون Searching for texts

ابر کلمه Word cloud

شناسایی موجودیت نامگذاری شده Named entity recognition

جستجوی متون در تصاویر Search for texts in images

آستانه تطبیقی گاوسی Gaussian adaptive thresholding