لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش راهنمای کامل NLP با R
Complete Guide to NLP with R
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
پردازش زبان طبیعی برای کلمات مانند دید کامپیوتری برای تصاویر است! NLP را با زبان برنامه نویسی R یاد بگیرید. در این دوره، مارک نیمن راس، فنشناس با تجربه به شما نشان میدهد که چگونه از زبان برنامهنویسی R برای پیادهسازی الگوریتمهای پردازش زبان طبیعی استفاده کنید. R به طور منحصر به فردی در دستکاری ماتریس ها و تولید آمار، که هر دو هسته اصلی NLP هستند، مهارت دارد. در مورد چارچوب هایی که می توانید با NLP استفاده کنید و همچنین اهمیت corpora و منابع بیاموزید. نحوه کار با فراداده NLP و پیش پردازش متن در آماده سازی برای NLP را بیاموزید. ایجاد داده های ساختاریافته، اعمال آمار در متن، و انجام تجزیه و تحلیل احساسات را کاوش کنید و سپس در تجسم NLP غوطه ور شوید. راه هایی برای استفاده از متن دقیق و quanteda R برای NLP کشف کنید. درک خود را از بدنه ها، نشانه ها و ماتریس ویژگی سند (DFM) ایجاد کنید. به علاوه، به تحلیل و تجسم بپردازید.
این دوره توسط Mark Niemann-Ross ایجاد شده است. ما خوشحالیم که میزبان این آموزش در کتابخانه خود هستیم.
سرفصل ها و درس ها
معرفی
Introduction
به پردازش زبان طبیعی با R خوش آمدید
Welcome to natural language processing with R
مهارت ها و ابزارهایی که برای موفقیت در این دوره نیاز دارید
Skills and tools you need to be successful in this course
1. بالا و در حال اجرا با tm
1. Up and Running with tm
tm چیست و چرا به آن نیاز دارید؟
What is tm and why do you need it?
NLP دنیای واقعی با متن مرتب
Real-world NLP with tidytext
NLP دنیای واقعی با tm
Real-world NLP with tm
NLP دنیای واقعی با کوانتدا
Real-world NLP with quanteda
2. Corpora و منابع
2. Corpora and Sources
ترکیب و تنظیم زیر مجموعه ها
Combining and subsetting corpora
بررسی منابع
Examining sources
شناخت مجموعه ها و منابع
Understanding corpora and sources
منابع سفارشی
Custom sources
بررسی اجسام
Examining corpora
3. کار با NLP Metadata
3. Working with NLP Metadata
ابرداده های مفید ایجاد کنید
Make useful metadata
کار با ابرداده سند
Working with document metadata
یافتن و فیلتر کردن بر اساس فراداده
Finding and filtering based on metadata
4. پیش پردازش متن در آماده سازی برای NLP
4. Preprocessing Text in Preparation for NLP
توکن سازی
Tokenization
بخشی از برچسب زدن گفتار
Part of speech tagging
تحولات
Transformations
ساقه
Stemming
Lemmatization
Lemmatization
N-گرم
N-grams
کلمات را متوقف کنید
Stop words
5. داده های ساخت یافته ایجاد کنید
5. Create Structured Data
ماتریس سند-ترم را متمرکز کنید
Focus the document-term matrix
ماتریس سند-ترم ایجاد کنید
Create the document-term matrix
وزن دهی ماتریس سند-ترم
Weighting the document-term matrix
درک ماتریس سند-ترم
Understanding the document-term matrix
6. آمار را روی متن اعمال کنید
6. Apply Statistics to Text
فرکانس ورد و سند
Word and document frequency
خوشه بندی سلسله مراتبی
Hierarchical clustering
اصطلاحات مرتبط
Associated terms
7. تجزیه و تحلیل احساسات
7. Sentiment Analysis
نمونه دنیای واقعی تحلیل احساسات
Real-world example of sentiment analysis
ابزار احساسات
Sentiment tools
تحلیل احساسات چیست؟
What is sentiment analysis?
مجموعه داده های احساسات
Sentiment datasets
8. تجسم پردازش زبان طبیعی
8. Visualizing Natural Language Processing
ابرهای کلمه
Word clouds
ترسیم قانون Zipf و Heap
Plotting Zipf’s and Heap’s Law
طراحی متن کاوی
Plotting text mining
9. نتیجه گیری
9. Conclusion
مراحل بعدی شما در NLP
Your next steps in NLP
10. مقدمه ای بر NLP Tidytext R
10. Introduction to NLP Tidytext R
به پردازش زبان طبیعی با R خوش آمدید
Welcome to natural language processing with R
مهارت هایی که برای موفقیت در این دوره به آن نیاز دارید
Skills you need to be successful in this course
11. استفاده از Tidytext برای NLP
11. Use of Tidytext for NLP
چگونه مانند متن مرتب فکر کنیم
How to think like tidytext
توکن کردن با unnest_tokens( )
Tokenizing with unnest_tokens( )
فرکانس ترم با bind_tf_idf( )
Term frequency with bind_tf_idf( )
واردات و صادرات از سایر بسته های NLP
Import and export from other NLP packages
تحلیل احساسات با احساسات ( )
Sentiment analysis with sentiments( )
بخش هایی از گفتار با parts_of_speech( )
Parts of speech with parts_of_speech( )
یک مثال: محبوب ترین اصطلاحات یک سند را محاسبه کنید
An example: Calculate the most popular terms in a document
ریشه زایی و ریشه یابی
Stemming and lemmatization
کلمات توقف، علائم نگارشی، فضای خالی و اعداد
Stopwords, punctuation, whitespace, and numbers
12. نتیجه گیری
12. Conclusion
مراحل بعدی
Next steps
13. مقدمه ای بر NLP با Quanteda R
13. Introduction to NLP with Quanteda R
مهارت ها و ابزارهایی که نیاز دارید
Skills and tools you need
به پردازش زبان طبیعی با R خوش آمدید
Welcome to natural language processing with R
14. شروع کار با Quanteda
14. Getting Started with Quanteda
مقدمه ای بر کوانتدا
Introduction to quanteda
Quanteda را نصب کنید
Install quanteda
15. درک Corpora
15. Understanding Corpora
یک پیکره را تغییر شکل داده و بخش بندی کنید
Reshape and segment a corpus
ایجاد ابرداده با docvars
Create metadata with docvars
خطوط را از یک پیکره حذف کنید
Remove lines from a corpus
زیر مجموعه ها و گروه های بدنه
Corpus subsets and groups
یک پیکره کوانتدا ایجاد کنید
Create a quanteda corpus
16. درک توکن ها
16. Understanding Tokens
بدنه و نشانه ها
Corpus and tokens
نشات گرفته با توکن ها
Stemming with tokens
نشانه ها و کلمات توقف را حذف کنید
Remove tokens and stopwords
فن شناس در زمینه سخت افزار ، نرم افزار و داستان های علمی باتجربه است
Mark Niemann-Ross یک تکنسین با تجربه در زمینه سخت افزار ، نرم افزار و داستان های علمی است.
مارک تقریباً 30 سال است که به توسعه دهندگان در پیمایش API ها کمک می کند و مسئولیت برنامه های شخص ثالث را در Quark و Adobe داشته است. وی علاوه بر فناوری عملی ، در زمینه آموزش فن آوری نیز مشارکت داشته است ، از دیپلم آموزش صنعتی شروع کرده و اخیراً به عنوان مدیر محتوا برای آموزش LinkedIn کار کرده است.
داستان علمی تخیلی مارک اخیراً در علمی تخیلی و واقعیت آنالوگ . او در حال حاضر مشغول کار بر روی یک رمز و راز قتل است که توسط یخچال حل شده است.
نمایش نظرات