آموزش تشخیص کاراکتر نوری (OCR) در پایتون

Optical Character Recognition (OCR) in Python

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: OpenCV، Tesseract، EasyOCR و EAST روی تصاویر و ویدیوها اعمال می شوند! OCR خود را از ابتدا با استفاده از یادگیری عمیق ایجاد کنید! استفاده از ابزارهای Tesseract، EAST و EasyOCR برای تشخیص متن در تصاویر و ویدئوها درک تفاوت‌های بین OCR در محیط‌های کنترل‌شده و طبیعی استفاده از تکنیک‌های پیش پردازش تصویر برای بهبود کیفیت تصویر، مانند: آستانه‌گذاری، وارونگی، تغییر اندازه، عملیات مورفولوژیکی و کاهش نویز استفاده کنید. معماری EAST و کتابخانه EasyOCR برای عملکرد بهتر در صحنه‌های طبیعی آموزش یک OCR از ابتدا با استفاده از یادگیری عمیق و شبکه‌های عصبی کانولوشنال استفاده از تکنیک‌های پردازش زبان طبیعی در متون استخراج‌شده توسط OCR (کلمه واژه و شناسایی موجودیت نام‌دار) پلاک‌خوانی پیش نیازها:برنامه‌نویسی اصول برنامه نویسی پایتون منطقی

در ناحیه دید کامپیوتر، زیر ناحیه تشخیص کاراکتر نوری (OCR) قرار دارد که هدف آن تبدیل تصاویر به متن است. OCR را می توان به عنوان تبدیل تصاویر حاوی متن تایپ شده، دست نویس یا چاپ شده به کاراکترهایی که ماشین می تواند درک کند، توصیف کرد. امکان تبدیل اسناد اسکن شده یا عکس گرفته شده به متون قابل ویرایش در هر ابزاری مانند Microsoft Word وجود دارد. یک برنامه رایج، خواندن خودکار فرم است که در آن می توانید عکس کارت اعتباری یا گواهینامه رانندگی خود را ارسال کنید و سیستم می تواند تمام داده های شما را بدون نیاز به تایپ دستی بخواند. یک ماشین خودران می تواند از OCR برای خواندن علائم راهنمایی و رانندگی استفاده کند و یک پارکینگ می تواند با خواندن پلاک خودروها دسترسی را تضمین کند!

برای اینکه شما را به این منطقه ببریم، در این دوره به صورت عملی یاد می گیرید که چگونه از کتابخانه های OCR برای تشخیص متن در تصاویر و ویدیوها استفاده کنید، تمام کدهایی که گام به گام با استفاده از زبان برنامه نویسی پایتون پیاده سازی شده اند! ما قصد داریم از Google Colab استفاده کنیم، بنابراین لازم نیست نگران نصب کتابخانه ها بر روی دستگاه خود باشید، زیرا همه چیز به صورت آنلاین با استفاده از GPU های Google توسعه می یابد! همچنین یاد خواهید گرفت که چگونه با استفاده از یادگیری عمیق و شبکه های عصبی کانولوشنال OCR خود را از ابتدا بسازید! در زیر می توانید سرفصل های اصلی دوره را بررسی کنید:

  • تشخیص متون در تصاویر و ویدئوها با استفاده از Tesseract، EasyOCR و EAST

  • عبارات خاص را در تصاویر با استفاده از عبارات منظم جستجو کنید

  • تکنیک‌هایی برای بهبود کیفیت تصویر، مانند: آستانه‌گذاری، وارونگی رنگ، مقیاس خاکستری، تغییر اندازه، حذف نویز، عملیات مورفولوژیکی و تبدیل پرسپکتیو

  • معماری EAST و کتابخانه EasyOCR برای عملکرد بهتر در صحنه‌های طبیعی

  • آموزش OCR از ابتدا با استفاده از TensorFlow و تکنیک های مدرن یادگیری عمیق، مانند شبکه های عصبی کانولوشن

  • کاربرد تکنیک‌های پردازش زبان طبیعی در متون استخراج‌شده توسط OCR (کلمه واژه و شناسایی موجودیت نام‌دار)

  • خواندن پلاک گواهینامه

اینها فقط برخی از موضوعات اصلی هستند! در پایان دوره، همه چیزهایی را که برای ایجاد پروژه های تشخیص متن خود با استفاده از OCR نیاز دارید، خواهید دانست!


سرفصل ها و درس ها

معرفی Introduction

  • محتوای دوره Course content

  • مقدمه ای بر OCR Introduction to OCR

  • مواد درسی Course materials

OCR با Tesseract OCR with Tesseract

  • مقدمه ای بر Tesseract Introduction to Tesseract

  • آماده سازی محیط Preparing the environment

  • اولین تشخیص متن First text recognition

  • پشتیبانی از زبان های دیگر Support for other languages

  • حالت تقسیم بندی صفحه (PSM) Page segmentation mode (PSM)

  • تشخیص جهت صفحه Page orientation detection

  • انتخاب متون 1 Selection of texts 1

  • انتخاب متون 2 Selection of texts 2

  • انتخاب متون 3 Selection of texts 3

  • جستجو با استفاده از عبارات منظم Search using regular expressions

  • تشخیص در سناریوهای طبیعی Detections in natural scenarios

تکنیک های پیش پردازش تصویر Techniques for image pre-processing

  • مقیاس خاکستری Grayscale

  • آستانه - شهود Thresholding - intuition

  • آستانه گذاری ساده Simple thresholding

  • آستانه گذاری با روش اوتسو Thresholding with Otsu method

  • آستانه تطبیقی Adaptive thresholding

  • آستانه تطبیقی ​​گاوسی Gaussian adaptive thresholding

  • وارونگی رنگ Color inversion

  • تغییر اندازه - شهود Resizing - intuition

  • تغییر اندازه - پیاده سازی Resizing - implementation

  • عملیات مورفولوژیکی - شهود Morphological operations - intuition

  • عملیات ریخت شناسی - اجرا Morphological operations - implementation

  • حذف نویز - شهود Noise removal - intuition

  • حذف نویز - اجرا Noise removal - implementation

  • تشخیص متن با OCR Text recognition with OCR

  • مشق شب HOMEWORK

  • راه حل تکلیف Homework solution

OCR با EAST برای صحنه های طبیعی OCR with EAST for natural scenes

  • شرق - مقدمه EAST - introduction

  • پیش پردازش تصویر Pre-processing the image

  • بارگذاری شبکه عصبی Loading the neural network

  • رمزگشایی تصویر 1 Decoding the image 1

  • رمزگشایی تصویر 2 Decoding the image 2

  • تشخیص متن Text recognition

آموزش OCR سفارشی Training a custom OCR

  • واردات کتابخانه ها Importing the libraries

  • مجموعه داده MNIST 0-9 MNIST 0-9 dataset

  • مجموعه داده Kaggle A-Z Kaggle A-Z dataset

  • پیوستن به مجموعه داده ها Joining the datasets

  • پیش پردازش داده ها Pre-processing the data

  • ساخت شبکه عصبی Building the neural network

  • آموزش شبکه عصبی Training the neural network

  • ارزیابی شبکه عصبی Evaluating the neural network

  • صرفه جویی در شبکه عصبی Saving the neural network

  • تست با تصاویر Testing with images

  • آماده سازی محیط Preparing the environment

  • پیش پردازش تصویر Pre-processing the image

  • تشخیص کانتور Contour detection

  • پردازش تشخیص ها 1 Processing the detections 1

  • پردازش تشخیص ها 2 Processing the detections 2

  • شخصیت شناسی Character recognition

  • مشکلات 0 و O، 1 و l، 5 و S Problems with 0 and O, 1 and l, 5 and S

  • مشکلات مربوط به متون شناسایی نشده Problems with undetected texts

سناریوهای طبیعی با EasyOCR Natural scenarios with EasyOCR

  • آماده سازی محیط Preparing the environment

  • تشخیص متن Text recognition

  • نوشتن نتایج روی تصویر Writing the results on the image

  • زبان های دیگر - فرانسوی و چینی Other languages - French and Chinese

  • تشخیص متن (پس زمینه) Text recognition (background)

OCR در ویدیوها OCR in videos

  • آماده سازی محیط Preparing the environment

  • تنظیمات ویدیو Video settings

  • در حال پردازش ویدیو Processing the video

  • OCR با EAST و Tesseract OCR with EAST and Tesseract

  • OCR با EasyOCR OCR with EasyOCR

پروژه 1: جستجوی عبارات خاص Project 1: Searching for specific terms

  • آماده سازی محیط Preparing the environment

  • تشخیص متن Text recognition

  • جستجوی متون Searching for texts

  • ابر کلمه Word cloud

  • شناسایی موجودیت نامگذاری شده Named entity recognition

  • جستجوی متون در تصاویر Search for texts in images

  • ذخیره نتایج Saving the results

پروژه 2: اسکنر + OCR Project 2: Scanner + OCR

  • آماده سازی محیط Preparing the environment

  • تشخیص کانتور Contour detection

  • دگرگونی چشم انداز Perspective transformation

  • OCR با Tesseract OCR with Tesseract

  • بهبود کیفیت تصویر Improving image quality

  • همه را کنار هم گذاشتن Putting all together

پروژه 3: پلاک خوانی Project 3: License plate reading

  • پیش پردازش تصویر Pre-processing the image

  • تشخیص متن Text recognition

  • بهبود کیفیت تصویر Improving image quality

محتوای اضافی 1: شبکه های عصبی مصنوعی Extra content 1: artificial neural networks

  • مبانی بیولوژیکی Biological fundamentals

  • پرسپترون تک لایه Single layer perceptron

  • پرسپترون چند لایه - توابع مجموع و فعال سازی Multilayer perceptron – sum and activation functions

  • پرسپترون چند لایه - محاسبه خطا Multilayer perceptron – error calculation

  • نزول گرادیان Gradient descent

  • پارامتر دلتا Delta parameter

  • به روز رسانی وزنه ها با پس انتشار Updating weights with backpropagation

  • تعصب، خطا، نزول گرادیان تصادفی، و پارامترهای بیشتر Bias, error, stochastic gradient descent, and more parameters

محتوای اضافی 2: شبکه های عصبی کانولوشنال Extra content 2: convolutional neural networks

  • مقدمه ای بر شبکه های عصبی کانولوشنال Introduction to convolutional neural networks

  • عملیات کانولوشن Convolutional operation

  • ادغام Pooling

  • صاف کردن Flattening

  • شبکه عصبی متراکم Dense neural network

اظهارات پایانی Final remarks

  • اظهارات پایانی Final remarks

  • جایزه BONUS

نمایش نظرات

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.

آموزش تشخیص کاراکتر نوری (OCR) در پایتون
جزییات دوره
13 hours
95
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
1,820
4.5 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jones Granatyr Jones Granatyr

استاد اولا! 10 مورد از جونز گراناتیر و ترابیلو در 10 سال گذشته است که شامل Inteligência Artificial (IA) می باشد استاد حرفه ای ، پشکیزادور و بنیانگذار پورتال IA Expert ، وب سایت com conteúdo específico sobre Inteligência Artificial. Desde que iniciei na Udemy criei vários cursos sobre diversos assuntos de IA، como as exemplolo: یادگیری عمیق ، یادگیری ماشین ، علم داده ، Redes Neurais Artificiais، Algoritmos Genéticos، Detecção e Reconhecimento Facial، Algoritmos de cesos، Busca ، Mineração de Regras de Associação ، Sistemas Especialistas e Sistemas de Recomendação. اگر بخواهید از طریق برنامه های مختلف زبان (Python ، R e Java) و یا فن آوری های مختلف (tensorflow ، keras ، pandas ، sklearn ، opencv ، dlib ، weka ، nltk ، به عنوان مثال) استفاده کنید. با توجه به هدف اصلی و دستیابی به اطلاعات IA و مجوز فعالیت در TI و متقاضیان ، به عنوان تجدید نظر در زمینه استفاده از قوانین و مقررات و امکان مشاهده تجدید نظرهای جدید در زمینه مشروبات الکلی ارائه می شود.

Gabriel Alves Gabriel Alves

توسعه دهنده Olá ، eu me chamo گابریل آلوس و به صورت رسمی در قالب Cienscia da Computação pela Universidade do Contestado (UnC) Porto União. Curso Técnico em Informática pelo Colégio Técnico de União da Vitória (COLTEC) ، نتیجه گیری در سال 2014. ما با استفاده از زبانهای ویژه و ویژه زبانهای پایتون ، با کیفیت مناسب ترجیح می دهیم که از هیچ یک از مصالح مصنوعی Inteligência استفاده نکنید. Sou desde semper apaixonado pela computação e por temas que envolvem ciência e tecnologia.

AI Expert Academy AI Expert Academy

مربی