پردازش متن با آموزش R

Processing Text with R Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: خطوط بزرگ داده و تجزیه و تحلیل امروز بیشتر و بیشتر داده های متنی تولید شده از طریق وب سایت ها ، رسانه های اجتماعی و ارتباطات خصوصی را مصرف می کنند. اما استخراج بینش از متن ساده نیست ؛ برای تهیه متن برای تجزیه و تحلیل و یادگیری ماشین به مجموعه ای از تکنیک ها و فرم ها نیاز دارد. در این دوره ، تکنیک های اساسی برای پاکسازی و پردازش متن در R را بیاموزید ، و نحوه تبدیل متن به فرم آماده برای تجزیه و تحلیل و پیش بینی ها را بیابید. Kumaran Ponnambalam با مرور تکنیک های استخراج ، پاکسازی و پردازش متن آغاز می شود. وی سپس نحوه تبدیل متن به فرم آماده برای تجزیه و تحلیل ، از جمله نحوه استفاده از n-گرم و TF-IDF را نشان می دهد. در طول دوره ، او مثالهایی را برای استفاده از این تکنیکها با استفاده از کتابخانه های R و tm ارائه می دهد.
موضوعات شامل:
  • دریافت متن از منابع مختلف
  • پاکسازی و تبدیل داده های متنی
  • آماده سازی ماتریس های TF-IDF برای یادگیری ماشین
  • ایجاد پایگاه داده n-gram برای پیش بینی متن
  • بهترین روشهای مقیاس پذیری و ذخیره متن

سرفصل ها و درس ها

مقدمه Introduction

  • ظهور تحلیلی متن The emergence of text analytics

1. آشنایی با متن کاوی 1. Introduction to Text Mining

  • هدف Purpose

  • سند Document

  • مجموعه نوشته ها Corpus

  • کتابخانه های پردازش متن R text processing libraries

  • تنظیم محیط Setting up the environment

2. Corpus در R 2. Corpus in R

  • PCorpus و VCorpus PCorpus and VCorpus

  • خواندن فایلها با CorpusReader Reading files with CorpusReader

  • کشف جسد Exploring the corpus

  • تداوم جسد Persisting the corpus

3. پاکسازی و استخراج متن 3. Text Cleansing and Extraction

  • تنظیم برای پردازش Setup for processing

  • پاک کردن متن Cleansing text

  • حذف کلمه را متوقف کنید Stop word removal

  • اشتعال Stemming

  • مدیریت ابرداده Managing metadata

4. TF-IDF 4. TF-IDF

  • آشنایی با tf-idf Introduction to tf-idf

  • تولید ماتریس فرکانس مدت Generating term frequency matrix

  • بهبود ماتریس فرکانس مدت Improving term frequency matrix

  • طرح ریزی فرکانس مدت Plotting term frequency

  • تولید tf-idf Generating tf-idf

5. ن-گرام 5. N-Grams

  • مفاهیم N-gram N-grams concepts

  • با استفاده از RWeka NGramTokenizer Using RWeka NGramTokenizer

  • ایجاد یک ماتریس فرکانس متن n-gram Creating an n-gram text frequency matrix

  • استخراج جفت n-گرم Extracting n-gram pairs

6. بهترین روشها 6. Best Practices

  • ذخیره متن Storing text

  • پردازش داده های متنی Processing text data

  • مقیاس پذیری Scalability

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

پردازش متن با آموزش R
جزییات دوره
55m 57s
28
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
3,431
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kumaran Ponnambalam Kumaran Ponnambalam

اختصاص به آموزش علوم داده

V2 Maestros به آموزش علوم داده و داده های بزرگ با هزینه های مقرون به صرفه برای جهان اختصاص دارد. مربیان ما تجربه دنیای واقعی در تمرین علم داده و ارائه نتایج تجاری دارند. علم داده یک حوزه داغ و در حال رخ دادن در صنعت فناوری اطلاعات است. متأسفانه منابع موجود برای یادگیری این مهارت به سختی یافت می شود و گران است. امیدواریم این مشکل را با ارائه آموزش باکیفیت با نرخ های مقرون به صرفه، با ایجاد استعدادهای علم داده در سراسر جهان، کاهش دهیم.