پردازش متن با آموزش پایتون

Processing Text with Python Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: در دنیای کلان داده ها ، اطلاعات بیشتر و بیشتر به صورت متن مورد مصرف و تجزیه و تحلیل قرار می گیرند. وب سایت ها ، رسانه های اجتماعی ، ایمیل ها و گپ ها به منابع اصلی داده ها و بینش تبدیل شده اند. اگر با داده کار می کنید ، درک نحوه برخورد با داده های متنی بدون ساختار ضروری است. در این دوره ، مربی Kumaran Ponnambalam به شما کمک می کند مجموعه مهارت های استخراج متن خود را که شامل تکنیک های اصلی استخراج ، پاکسازی و پردازش متن در پایتون است ، بسازید. کوماران مفاهیم کلیدی پردازش متن مانند توکن سازی و بنویس را مرور می کند. وی همچنین به تکنیک های تبدیل متن به فرم آماده برای تجزیه و تحلیل ، از جمله n گرم و TF-IDF نگاه می کند. در طول راه ، او نمونه هایی از این روش ها را با استفاده از پایتون و کتابخانه NLTK ارائه می دهد.
موضوعات شامل:
  • روابط اسناد داخل یک گروه را تفسیر کنید.
  • بین توانایی های مختلف پردازش متن که NLTK ارائه می دهد تفاوت قائل شوید.
  • توضیح دهید که چرا هنگام پردازش متن با پایتون ، پاک سازی و استخراج متن انجام می شود.
  • مراحل پیشرفته پردازش متن را برای یافتن و ایجاد آرایه TF-IDF و TF-IDF اعمال کنید.
  • بهترین روش ها را هنگام پردازش متن با پایتون توضیح دهید.

سرفصل ها و درس ها

مقدمه Introduction

  • نیاز به مهارت های استخراج متن در علم داده The need for text mining skills in data science

1. استخراج متن 1. Text Mining

  • متن کاوی امروز Text mining today

  • مفاهیم اسناد Document concepts

  • مفاهیم پارسی Corpus concepts

  • معرفی کتابخانه NLTK Introduction to the NLTK library

  • تنظیم محیط Setting up the environment

2. خواندن متن 2. Reading Text

  • خواندن پرونده های خام Reading raw files

  • خواندن فایلها با دستگاه خواننده Reading files with corpus reader

  • کشف جسد Exploring the corpus

  • تجزیه و تحلیل جنازه Analyzing the corpus

3. پاکسازی و استخراج متن 3. Text Cleansing and Extraction

  • نشانه گذاری Tokenization

  • پاک کردن متن Cleansing text

  • حذف کلمه را متوقف کنید Stop word removal

  • اشتعال Stemming

  • لمس کردن Lemmatization

4. پردازش پیشرفته متن 4. Advanced Text Processing

  • ساخت n-گرم Building n-grams

  • برچسب زدن بخش هایی از گفتار Tagging parts of speech

  • فرکانس سند فرکانس معکوس مدت (TF-IDF) Term frequency-inverse document frequency (TF-IDF)

  • ساخت یک ماتریس TF-IDF Building a TF-IDF matrix

5- بهترین روشها 5. Best Practices

  • ذخیره متن Storing text

  • پردازش داده های متنی Processing text data

  • پردازش مقیاس پذیر داده های متن Scalable processing of text data

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

پردازش متن با آموزش پایتون
جزییات دوره
33m 31s
23
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
13,504
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kumaran Ponnambalam Kumaran Ponnambalam

اختصاص به آموزش علوم داده

V2 Maestros به آموزش علوم داده و داده های بزرگ با هزینه های مقرون به صرفه برای جهان اختصاص دارد. مربیان ما تجربه دنیای واقعی در تمرین علم داده و ارائه نتایج تجاری دارند. علم داده یک حوزه داغ و در حال رخ دادن در صنعت فناوری اطلاعات است. متأسفانه منابع موجود برای یادگیری این مهارت به سختی یافت می شود و گران است. امیدواریم این مشکل را با ارائه آموزش باکیفیت با نرخ های مقرون به صرفه، با ایجاد استعدادهای علم داده در سراسر جهان، کاهش دهیم.