آموزش استخراج هوشمند متن و داده از سند با OCR NER

Intelligently Extract Text & Data from Document with OCR NER

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: توسعه پروژه برنامه اسکنر سند که استخراج موجودیت نامگذاری شده از اسناد اسکن با OpenCV، Pytesseract، Spacy Develop و Train Named Entity Recognition Model است نه تنها متن را از تصویر استخراج کنید، بلکه موجودیت ها را از کارت ویزیت استخراج کنید. توسعه اسکنر کارت ویزیت مانند ABBY از سطح بالا. تکنیک‌های پیش پردازش داده برای مشکل زبان طبیعی برنامه‌های NER زمان واقعی پیش نیازها: حداقل باید در پایتون مبتدی باشد.

به دوره آموزشی "استخراج هوشمند داده متن از سند با OCR NER" خوش آمدید!!!

در این دوره آموزشی یاد خواهید گرفت که چگونه به صورت سفارشی Named Entity Recognizer بسازید. ایده اصلی این دوره استخراج موجودیت ها از اسناد اسکن شده مانند فاکتور، کارت بازرگانی، قبض حمل، بارنامه و اسناد می باشد. اما می توانید از چارچوب توضیح داده شده برای انواع اسناد مالی استفاده کنید. در زیر برنامه درسی ارائه شده است که ما برای توسعه پروژه دنبال می کنیم.

برای توسعه این پروژه از دو فناوری اصلی در علم داده استفاده خواهیم کرد:

  1. بینایی کامپیوتر

  2. پردازش زبان طبیعی

در ماژول Computer Vision، سند را اسکن می کنیم، محل متن را شناسایی می کنیم و در نهایت متن را از تصویر استخراج می کنیم. سپس در پردازش زبان طبیعی، عنوان‌ها را از متن استخراج می‌کنیم و پاکسازی متن لازم را انجام می‌دهیم و موجودیت‌های متن را تجزیه می‌کنیم.


کتابخانه‌های پایتون مورد استفاده در ماژول بینایی رایانه.

  • OpenCV

  • Numpy

  • Pytesseract

کتابخانه های پایتون مورد استفاده در پردازش زبان طبیعی

  • فضا

  • پاندا

  • عبارت منظم

  • رشته


همانطور که دو فناوری اصلی را برای توسعه پروژه ترکیب می‌کنیم، برای درک آسان، دوره را به چند مرحله از توسعه تقسیم می‌کنیم.

مرحله -1: ما پروژه را با انجام نصب‌ها و الزامات لازم راه‌اندازی می‌کنیم.

  • پایتون را نصب کنید

  • وابسته ها را نصب کنید

مرحله -2: ما آماده سازی داده ها را انجام خواهیم داد. یعنی ما متن را با استفاده از Pytesseract از تصاویر استخراج می کنیم و همچنین پاکسازی لازم را انجام می دهیم.

  • تصاویر جمع آوری کنید

  • نمای کلی در Pytesseract

  • متن را از تمام تصاویر استخراج کنید

  • پاک کردن و آماده کردن متن

مرحله -3: نحوه برچسب گذاری داده های NER با استفاده از برچسب گذاری BIO را خواهیم دید.

  • برچسب زدن دستی با تکنیک BIO

    • B - شروع

    • I - داخل

    • O - خارج

مرحله -4: ما متن را بیشتر پاکسازی می کنیم و داده ها را برای آموزش یادگیری ماشین از قبل پردازش می کنیم.

  • داده های آموزشی را برای Spacy آماده کنید

  • تبدیل داده ها به قالب فضایی

مرحله -5: با داده های پیش پردازش، مدل نهاد نامگذاری شده را آموزش خواهیم داد.

  • پیکربندی مدل NER

  • مدل را آموزش دهید

مرحله -6: عنوان‌ها را با استفاده از NER و مدل‌سازی پیش‌بینی می‌کنیم و خط لوله داده را برای تجزیه متن ایجاد می‌کنیم.

  • مدل بارگذاری

  • ارائه و ارائه با Displacy

  • کادر مرزی را روی تصویر بکشید

  • عنوان ها را از متن تجزیه کنید


در نهایت، همه را کنار هم می گذاریم و برنامه اسکنر اسناد را ایجاد می کنیم.

آماده اید !!!

اجازه دهید توسعه پروژه هوش مصنوعی را شروع کنیم.


سرفصل ها و درس ها

معرفی Introduction

  • معرفی Introduction

  • طرح پروژه Project Plan

  • سند پروژه Project Document

  • منابع را دانلود کنید Download the Resources

  • با مشکلی در دوره مواجه هستید؟ راه حل اینجاست Facing any Issue with the Course ? Here is the solution

راه اندازی پروژه Project Setup

  • پایتون را نصب کنید Install Python

  • محیط مجازی را نصب کنید Install Virtual Environment

  • بسته ها را در محیط مجازی نصب کنید Install Packages into Virtual Environment

  • Tesseract OCR و Pytesseract را نصب کنید Install Tesseract OCR & Pytesseract

  • SpaCy را نصب کنید Install spaCy

  • تست کنید، بسته ها نصب می شوند Test, the packages are installed

آماده سازی داده ها Data Preparation

  • کارت ویزیت را با استفاده از OpenCV و PIL بارگیری کنید Load Business Card using OpenCV & PIL

  • Pytesseract: متن را از Image استخراج کنید Pytesseract: Extract text from Image

  • Pytesseract: خطای Tesseract Pytesseract: Tesseract Error

  • Pytesseract: Pytesseract چگونه کار می کند؟ Pytesseract: How Pytesseract with work ?

  • Pytesseract: تصویر به متن به دیتافریم Pytesseract: Image to text to dataframe

  • Pytesseract: پاک کردن متن در Dataframe Pytesseract: Clean Text in Dataframe

  • Pytesseract: اطراف هر کلمه را باکس مرزی بکشید Pytesseract: Draw Bounding Box around each word

  • متن و داده ها را از تمام کارت ویزیت استخراج کنید Extract Text and Data from all Business Card

  • ذخیره داده ها در csv Save data in csv

  • برچسب زدن Labeling

پیش پردازش و پاکسازی داده ها Data Preprocessing and Cleaning

  • فرمت داده های آموزشی فضایی Spacy Training Data Format

  • داده ها را بارگیری کنید و به Pandas DataFrame تبدیل کنید Load Data and convert into Pandas DataFrame

  • کد به روز شده Updated Code.

  • متن تمیز کردن Cleaning Text

  • تبدیل داده ها به فرمت فضایی Convert Data into spacy format

  • نهادهای آزمایشی Testing Entities

  • تبدیل داده ها به فرمت فضایی برای تمام متن های کارت ویزیت Convert data into spacy format for all Business card text

  • تقسیم داده ها به مجموعه آموزشی و آزمایشی Splitting Data into Training and Testing Set

مدل تشخیص نهاد با نام قطار (NER). Train Named Entity Recognition (NER) model

  • Spacy: پیکربندی را پر کنید Spacy: Fill the Configuration

  • Spacy: داده ها را آماده کنید Spacy: Prepare Data

  • Spacy: مدل خط لوله قطار NER Spacy: Train NER pipeline model

  • Spacy: Save Model NER Spacy: Save NER Model

پیش بینی ها Predictions

  • واردات کتابخانه های مورد نیاز Import Required Libraries

  • تابع متن پاک Clean Text Function

  • مدل NER فضای بار Load Spacy NER Model

  • متن را از تصویر استخراج کرده و به قاب داده تبدیل کنید Extract Text from Image and Convert into Data Frame

  • Data Frame را به Content تبدیل کنید Convert Data Frame into Content

  • نهادهای نامگذاری شده را از مدل دریافت کنید Get Named Entities from model

  • رندر جابجایی Displacy render

  • برچسب زدن به هر کلمه Tagging Each Word

  • به Label tokens dataframe بپیوندید Join Label to tokens dataframe

  • به دیتافریم توکن با داده های Pytesseract بپیوندید Join token dataframe with Pytesseract data

  • جعبه محدود کردن و برچسب گذاری موجودیت های پیش بینی شده Bounding Box and Tagging Predicted Entities

  • اطلاعات BIO را با هم ترکیب کنید Combine the BIO information

  • جعبه مرزی Bounding Box

  • تابع تجزیه Parsing Function

  • آزمایش کردن Testing

  • عناوین را تجزیه کنید Parse Entitles

  • عملکرد پیش بینی ها Predictions Function

  • خط لوله پیش بینی نهایی Final Prediction Pipeline

بهبود عملکرد مدل Improve Model Performance

  • ایده هایی برای بهبود دقت مدل Ideas to Improve model accuracy

  • چارچوب مدل نسخه 2: پیش پردازش داده ها Version-2 model framework: Data Preprocessing

  • مدل قطار نسخه 2 Train Version 2 model

  • پیش بینی ها را از مدل دریافت کنید Get Predictions from the model

اسکنر اسناد Document Scanner

  • منابع را دانلود کنید Download the Resources

  • اسکنر اسناد در OpenCV چیست و چرا؟ What and Why Document Scanner in OpenCV ?

  • تنظیم و خواندن تصویر Setup and Read Image

  • تغییر اندازه تصویر با نسبت تصویر یکسان Resize Image with same aspect ratio

  • تشخیص لبه (تقویت، تاری و Canny) برای سند Edge Detection (Enhance, Blur and Canny) to Document

  • گشاد کردن لبه ها با تبدیل مورفولوژیکی Dilate Edges with morphological transform

  • تعداد چهار نقطه را پیدا کنید (محل سند را شناسایی کنید) Find Four Point Countours (Identify Location of document)

  • تبدیل Wrap را اعمال کنید و فقط سند را برش دهید Apply Wrap transform and crop only document

  • عملکرد اسکنر اسناد: قرار دادن همه با هم Document Scanner Function: Putting All together

  • رنگ جادویی به تصویر Magic Color to Image

  • ادغام پیش بینی های NER Integrate NER Predictions

برنامه وب اسکنر اسناد Document Scanner Web App

  • چه چیزی را توسعه خواهید داد؟ What will you Develop ?

  • دانلود اپلیکیشن وب Download Web App

  • راه اندازی پروژه برنامه وب Setting Up Web App Project

  • VS Code را نصب کنید Install VS Code

  • Flask را نصب کنید Install Flask

  • اولین برنامه فلاسک First Flask App

  • فایل HTML را با سرور Flask اجرا کنید Run HTML file with Flask server

  • مراحل طراحی اپلیکیشن وب ما Our Web App design steps

  • مرحله 1: صفحه طراحی: نوار ناوبری در HTML ایجاد کنید Step-1: Design Page: Create Navigation Bar in HTML

  • مرحله 1: ایجاد صفحه درباره Step-1: Create About Page

  • مرحله 2: برای آپلود تصویر یا فایل در HTML فرم HTML ایجاد کنید Step-2: Create HTML form to Upload Image or File in HTML

  • مرحله 3: نحوه پیش بینی مختصات سند با پایتون در فلاسک Step-3: How to Predict document coordinates with Python in Flask

  • مرحله 2: تصویر پشتیبان را آپلود و ذخیره کنید: settings.py را ایجاد کنید Step-2: Upload and save image Backend : create settings.py

  • مرحله 2: آپلود و ذخیره تصویر Backend: ذخیره تصویر از فرم HTML Step-2: Upload and save image Backend: save image from HTML form

  • مرحله 3: اسکن اسناد Step-3: Document Scanning

  • مختصات سند را با استفاده از جاوا اسکریپت تنظیم کنید Adjust coordinates of document using JavaScript

  • سند را بپیچید و برش دهید و تصویر را ذخیره کنید Wrap and Crop the document and save the image

  • دریافت پیش بینی ها Get Predictions

  • صفحه پیش بینی طراحی Design Predictions page

  • نمایش نتایج در جدول Display results in table

  • نهایی Final

ضمیمه Appendix

  • محدودیت های Pytesseract Limitations of Pytesseract

جایزه BONUS

  • سخنرانی پاداش: مراحل بعدی Bonus Lecture: Next Steps

نمایش نظرات

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.

آموزش استخراج هوشمند متن و داده از سند با OCR NER
جزییات دوره
7.5 hours
89
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
1,748
4.7 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Data Science Anywhere Team Data Science Anywhere Team

تیم مهندس و توسعه دهندگان سلام ، ما تیمی متشکل از کارشناسان یادگیری ماشین ، توسعه دهندگان هوش مصنوعی هستیم که با هم همکاری می کنند تا وضعیت هنر هوش مصنوعی را پیشرفت دهند. وقتی دوره های جدید آزاد می شوید ، با پرسش و پاسخ و بسیاری موارد دیگر از ما می شنوید. ما در اینجا هستیم تا به شما کمک کنیم در لبه پیشرفته علم و فناوری داده بمانید. با تشکر، تیم Data Science Anywhere

Srikanth Gusksra Srikanth Gusksra

توسعه دهنده هوش مصنوعی سلام به همه ، ما تیم دانشمندان داده هستیم و در طول دوره با شما همراه خواهیم بود. ما به تمام س yourالات شما در رابطه با دوره پاسخ خواهیم داد و اگر در اجرای کد ساختار دارید ، به شما کمک می کنیم خطاها را برطرف کنید. بسیار سپاسگزارم و یادگیری مبارک. علم داده در هر کجا

Convolution Academy Convolution Academy

تیم