لطفا جهت پرداخت (ورود به درگاه بانک) فیلترشکن خود را خاموش نمایید.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
پردازش متن با آموزش R
Processing Text with R Essential Training
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
خطوط بزرگ داده و تجزیه و تحلیل امروز بیشتر و بیشتر داده های متنی تولید شده از طریق وب سایت ها ، رسانه های اجتماعی و ارتباطات خصوصی را مصرف می کنند. اما استخراج بینش از متن ساده نیست ؛ برای تهیه متن برای تجزیه و تحلیل و یادگیری ماشین به مجموعه ای از تکنیک ها و فرم ها نیاز دارد. در این دوره ، تکنیک های اساسی برای پاکسازی و پردازش متن در R را بیاموزید ، و نحوه تبدیل متن به فرم آماده برای تجزیه و تحلیل و پیش بینی ها را بیابید. Kumaran Ponnambalam با مرور تکنیک های استخراج ، پاکسازی و پردازش متن آغاز می شود. وی سپس نحوه تبدیل متن به فرم آماده برای تجزیه و تحلیل ، از جمله نحوه استفاده از n-گرم و TF-IDF را نشان می دهد. در طول دوره ، او مثالهایی را برای استفاده از این تکنیکها با استفاده از کتابخانه های R و tm ارائه می دهد.
موضوعات شامل:
دریافت متن از منابع مختلف li>
پاکسازی و تبدیل داده های متنی li>
آماده سازی ماتریس های TF-IDF برای یادگیری ماشین li>
ایجاد پایگاه داده n-gram برای پیش بینی متن li>
بهترین روشهای مقیاس پذیری و ذخیره متن li>
سرفصل ها و درس ها
مقدمه
Introduction
ظهور تحلیلی متن
The emergence of text analytics
1. آشنایی با متن کاوی
1. Introduction to Text Mining
هدف
Purpose
سند
Document
مجموعه نوشته ها
Corpus
کتابخانه های پردازش متن
R text processing libraries
تنظیم محیط
Setting up the environment
2. Corpus در R
2. Corpus in R
PCorpus و VCorpus
PCorpus and VCorpus
خواندن فایلها با CorpusReader
Reading files with CorpusReader
کشف جسد
Exploring the corpus
تداوم جسد
Persisting the corpus
3. پاکسازی و استخراج متن
3. Text Cleansing and Extraction
تنظیم برای پردازش
Setup for processing
پاک کردن متن
Cleansing text
حذف کلمه را متوقف کنید
Stop word removal
اشتعال
Stemming
مدیریت ابرداده
Managing metadata
4. TF-IDF
4. TF-IDF
آشنایی با tf-idf
Introduction to tf-idf
تولید ماتریس فرکانس مدت
Generating term frequency matrix
بهبود ماتریس فرکانس مدت
Improving term frequency matrix
طرح ریزی فرکانس مدت
Plotting term frequency
تولید tf-idf
Generating tf-idf
5. ن-گرام
5. N-Grams
مفاهیم N-gram
N-grams concepts
با استفاده از RWeka NGramTokenizer
Using RWeka NGramTokenizer
ایجاد یک ماتریس فرکانس متن n-gram
Creating an n-gram text frequency matrix
لینکدین: شبکه اجتماعی حرفهای برای ارتباط و کارآفرینی
لینکدین به عنوان یکی از بزرگترین شبکههای اجتماعی حرفهای، به میلیونها افراد در سراسر جهان این امکان را میدهد تا ارتباط برقرار کنند، اطلاعات حرفهای خود را به اشتراک بگذارند و فرصتهای شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان میدهد تا رزومه حرفهای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمنها و گروههای حرفهای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهرهمند شوند.
لینکدین همچنین به کارفرمایان امکان میدهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفهای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصتهای شغلی و گسترش شبکه حرفهای خود، نقش مهمی را ایفا میکند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفهای در دنیای امروز مورد توجه قرار دارد.
V2 Maestros به آموزش علوم داده و داده های بزرگ با هزینه های مقرون به صرفه برای جهان اختصاص دارد. مربیان ما تجربه دنیای واقعی در تمرین علم داده و ارائه نتایج تجاری دارند. علم داده یک حوزه داغ و در حال رخ دادن در صنعت فناوری اطلاعات است. متأسفانه منابع موجود برای یادگیری این مهارت به سختی یافت می شود و گران است. امیدواریم این مشکل را با ارائه آموزش باکیفیت با نرخ های مقرون به صرفه، با ایجاد استعدادهای علم داده در سراسر جهان، کاهش دهیم.
نمایش نظرات