آموزش راهنمای کامل NLP با R

Complete Guide to NLP with R

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

پردازش زبان طبیعی برای کلمات مانند دید کامپیوتری برای تصاویر است! NLP را با زبان برنامه نویسی R یاد بگیرید. در این دوره، مارک نیمن راس، فن‌شناس با تجربه به شما نشان می‌دهد که چگونه از زبان برنامه‌نویسی R برای پیاده‌سازی الگوریتم‌های پردازش زبان طبیعی استفاده کنید. R به طور منحصر به فردی در دستکاری ماتریس ها و تولید آمار، که هر دو هسته اصلی NLP هستند، مهارت دارد. در مورد چارچوب هایی که می توانید با NLP استفاده کنید و همچنین اهمیت corpora و منابع بیاموزید. نحوه کار با فراداده NLP و پیش پردازش متن در آماده سازی برای NLP را بیاموزید. ایجاد داده های ساختاریافته، اعمال آمار در متن، و انجام تجزیه و تحلیل احساسات را کاوش کنید و سپس در تجسم NLP غوطه ور شوید. راه هایی برای استفاده از متن دقیق و quanteda R برای NLP کشف کنید. درک خود را از بدنه ها، نشانه ها و ماتریس ویژگی سند (DFM) ایجاد کنید. به علاوه، به تحلیل و تجسم بپردازید.

این دوره توسط Mark Niemann-Ross ایجاد شده است. ما خوشحالیم که میزبان این آموزش در کتابخانه خود هستیم.


سرفصل ها و درس ها

معرفی Introduction

  • به پردازش زبان طبیعی با R خوش آمدید Welcome to natural language processing with R

  • مهارت ها و ابزارهایی که برای موفقیت در این دوره نیاز دارید Skills and tools you need to be successful in this course

1. بالا و در حال اجرا با tm 1. Up and Running with tm

  • tm چیست و چرا به آن نیاز دارید؟ What is tm and why do you need it?

  • NLP دنیای واقعی با متن مرتب Real-world NLP with tidytext

  • NLP دنیای واقعی با tm Real-world NLP with tm

  • NLP دنیای واقعی با کوانتدا Real-world NLP with quanteda

2. Corpora و منابع 2. Corpora and Sources

  • ترکیب و تنظیم زیر مجموعه ها Combining and subsetting corpora

  • بررسی منابع Examining sources

  • شناخت مجموعه ها و منابع Understanding corpora and sources

  • منابع سفارشی Custom sources

  • بررسی اجسام Examining corpora

3. کار با NLP Metadata 3. Working with NLP Metadata

  • ابرداده های مفید ایجاد کنید Make useful metadata

  • کار با ابرداده سند Working with document metadata

  • یافتن و فیلتر کردن بر اساس فراداده Finding and filtering based on metadata

4. پیش پردازش متن در آماده سازی برای NLP 4. Preprocessing Text in Preparation for NLP

  • توکن سازی Tokenization

  • بخشی از برچسب زدن گفتار Part of speech tagging

  • تحولات Transformations

  • ساقه Stemming

  • Lemmatization Lemmatization

  • N-گرم N-grams

  • کلمات را متوقف کنید Stop words

5. داده های ساخت یافته ایجاد کنید 5. Create Structured Data

  • ماتریس سند-ترم را متمرکز کنید Focus the document-term matrix

  • ماتریس سند-ترم ایجاد کنید Create the document-term matrix

  • وزن دهی ماتریس سند-ترم Weighting the document-term matrix

  • درک ماتریس سند-ترم Understanding the document-term matrix

6. آمار را روی متن اعمال کنید 6. Apply Statistics to Text

  • فرکانس ورد و سند Word and document frequency

  • خوشه بندی سلسله مراتبی Hierarchical clustering

  • اصطلاحات مرتبط Associated terms

7. تجزیه و تحلیل احساسات 7. Sentiment Analysis

  • نمونه دنیای واقعی تحلیل احساسات Real-world example of sentiment analysis

  • ابزار احساسات Sentiment tools

  • تحلیل احساسات چیست؟ What is sentiment analysis?

  • مجموعه داده های احساسات Sentiment datasets

8. تجسم پردازش زبان طبیعی 8. Visualizing Natural Language Processing

  • ابرهای کلمه Word clouds

  • ترسیم قانون Zipf و Heap Plotting Zipf’s and Heap’s Law

  • طراحی متن کاوی Plotting text mining

9. نتیجه گیری 9. Conclusion

  • مراحل بعدی شما در NLP Your next steps in NLP

10. مقدمه ای بر NLP Tidytext R 10. Introduction to NLP Tidytext R

  • به پردازش زبان طبیعی با R خوش آمدید Welcome to natural language processing with R

  • مهارت هایی که برای موفقیت در این دوره به آن نیاز دارید Skills you need to be successful in this course

11. استفاده از Tidytext برای NLP 11. Use of Tidytext for NLP

  • چگونه مانند متن مرتب فکر کنیم How to think like tidytext

  • توکن کردن با unnest_tokens( ) Tokenizing with unnest_tokens( )

  • فرکانس ترم با bind_tf_idf( ) Term frequency with bind_tf_idf( )

  • واردات و صادرات از سایر بسته های NLP Import and export from other NLP packages

  • تحلیل احساسات با احساسات ( ) Sentiment analysis with sentiments( )

  • بخش هایی از گفتار با parts_of_speech( ) Parts of speech with parts_of_speech( )

  • یک مثال: محبوب ترین اصطلاحات یک سند را محاسبه کنید An example: Calculate the most popular terms in a document

  • ریشه زایی و ریشه یابی Stemming and lemmatization

  • کلمات توقف، علائم نگارشی، فضای خالی و اعداد Stopwords, punctuation, whitespace, and numbers

12. نتیجه گیری 12. Conclusion

  • مراحل بعدی Next steps

13. مقدمه ای بر NLP با Quanteda R 13. Introduction to NLP with Quanteda R

  • مهارت ها و ابزارهایی که نیاز دارید Skills and tools you need

  • به پردازش زبان طبیعی با R خوش آمدید Welcome to natural language processing with R

14. شروع کار با Quanteda 14. Getting Started with Quanteda

  • مقدمه ای بر کوانتدا Introduction to quanteda

  • Quanteda را نصب کنید Install quanteda

15. درک Corpora 15. Understanding Corpora

  • یک پیکره را تغییر شکل داده و بخش بندی کنید Reshape and segment a corpus

  • ایجاد ابرداده با docvars Create metadata with docvars

  • خطوط را از یک پیکره حذف کنید Remove lines from a corpus

  • زیر مجموعه ها و گروه های بدنه Corpus subsets and groups

  • یک پیکره کوانتدا ایجاد کنید Create a quanteda corpus

16. درک توکن ها 16. Understanding Tokens

  • بدنه و نشانه ها Corpus and tokens

  • نشات گرفته با توکن ها Stemming with tokens

  • نشانه ها و کلمات توقف را حذف کنید Remove tokens and stopwords

  • توکن های گروهی Group tokens

17. درک ماتریس سند-ویژگی (DFM) 17. Understanding Document-Feature Matrix (DFM)

  • تجزیه و تحلیل دنیای واقعی با DFM Real-world analysis with DFM

  • یک DFM ایجاد و اصلاح کنید Create and modify a DFM

  • Corpus، نشانه‌ها و DFM Corpus, tokens, and DFM

18. تجزیه و تحلیل و تجسم 18. Analysis and Visualization

  • تجسم با نمودارهای متنی Visualization with textplots

  • بسته quanteda textstats The quanteda textstats package

  • بسته احساسی کوانتدا را درک کنید Understand the quanteda sentiment package

  • تحلیل احساسات دنیای واقعی با احساسات کوانتدا Real-world sentiment analysis with quanteda sentiment

  • آمار متن در دنیای واقعی با آمارهای متنی Real-world text statistics with textstats

  • از dplyr با quanteda استفاده کنید Use dplyr with quanteda

19. نتیجه گیری 19. Conclusion

  • مراحل بعدی شما در NLP Your next steps in NLP

20. پروژه Capstone 20. Capstone Project

  • توضیح پروژه Project explanation

  • معرفی پروژه Project introduction

نمایش نظرات

آموزش راهنمای کامل NLP با R
جزییات دوره
5h 4m
73
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
12
- از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mark Niemann-Ross Mark Niemann-Ross

فن شناس در زمینه سخت افزار ، نرم افزار و داستان های علمی باتجربه است Mark Niemann-Ross یک تکنسین با تجربه در زمینه سخت افزار ، نرم افزار و داستان های علمی است.

مارک تقریباً 30 سال است که به توسعه دهندگان در پیمایش API ها کمک می کند و مسئولیت برنامه های شخص ثالث را در Quark و Adobe داشته است. وی علاوه بر فناوری عملی ، در زمینه آموزش فن آوری نیز مشارکت داشته است ، از دیپلم آموزش صنعتی شروع کرده و اخیراً به عنوان مدیر محتوا برای آموزش LinkedIn کار کرده است.

داستان علمی تخیلی مارک اخیراً در علمی تخیلی و واقعیت آنالوگ . او در حال حاضر مشغول کار بر روی یک رمز و راز قتل است که توسط یخچال حل شده است.