آموزش علم داده: داده کاوی و پردازش زبان طبیعی در R

Data Science:Data Mining & Natural Language Processing in R

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: از قدرت یادگیری ماشینی در R برای داده/متن کاوی و پردازش زبان طبیعی با مثال‌های عملی استفاده کنید. انجام یادگیری نظارت شده با ساخت مدل های طبقه بندی و رگرسیون در R ارزیابی دقت الگوریتم های یادگیری ماشینی نظارت شده و مقایسه عملکرد آنها در R انجام تجزیه و تحلیل احساسات با استفاده از داده های متنی در R پیش نیازها:علاقه شدید به یادگیری در مورد علم داده و داده کاوی علاقه شدید در کاوی و استخراج بینش از داده های متنی باید تجربه قبلی استفاده از R و RStudio را داشته باشد باید قادر به نصب و خواندن در بسته های R باشد قبل از قرار گرفتن در معرض اصول تجزیه و تحلیل آماری داده ها، تجسم داده ها و خلاصه سازی در R مفید است اما ضروری نیست.

                      

                               علوم داده، متن کاوی و پردازش زبان طبیعی در R:

انجام وظایف پیش پردازش، تجسم و یادگیری ماشینی مانند: خوشه بندی، طبقه بندی و رگرسیون در R را بیاموزید. شما قادر خواهید بود از داده های متنی و توییتر بینش استخراج کنید تا به شرکت خود مزیت رقابتی بدهید.

                               از یک دانشمند داده خبره  با +5 سال تجربه بیاموزید:

نام من مینروا سینگ است و من فارغ التحصیل کارشناسی ارشد دانشگاه آکسفورد (جغرافیا و محیط زیست) هستم. من اخیراً دکترای خود را در دانشگاه کمبریج (اکولوژی و حفاظت گرمسیری) به پایان رساندم.
من چندین سال تجربه در تجزیه و تحلیل داده های واقعی از منابع مختلف با استفاده از تکنیک های مرتبط با علم داده و تولید نشریات برای مجلات بین المللی دارم. در طول تحقیقاتم متوجه شدم که تقریباً تمام دوره‌ها و کتاب‌های علوم داده R ماهیت چند بعدی موضوع را در نظر نمی‌گیرند و از علم داده به جای یادگیری ماشین استفاده می‌کنند.
این به دانش‌آموزان دانش ناقصی از موضوع می‌دهد. . برخلاف سایر دوره‌های آموزشی، ما در یادگیری ماشینی متوقف نمی‌شویم. ما همچنین داده‌کاوی، وب‌اسکریپ، متن کاوی و پردازش زبان طبیعی را به همراه استخراج سایت‌های رسانه‌های اجتماعی مانند Twitter و Facebook برای داده‌های متنی پوشش خواهیم داد.

                                نیازی به دانش قبلی یا آمار/ماشینی نیست:

شما با جذب ارزشمندترین اصول و تکنیک های R Data Science شروع خواهید کرد. من از روش‌های ساده و کاربردی برای ساده‌سازی و پرداختن به سخت‌ترین مفاهیم در R استفاده می‌کنم.
دوره آموزشی من به شما کمک می‌کند روش‌ها را با استفاده از داده‌های واقعی به‌دست‌آمده از منابع مختلف پیاده‌سازی کنید. بسیاری از دوره‌ها از داده‌های ساختگی استفاده می‌کنند که دانش‌آموزان را قادر به پیاده‌سازی علم داده مبتنی بر R در زندگی واقعی نمی‌کند. پس از گذراندن این دوره، به راحتی از بسته هایی مانند caret، dplyr برای کار با داده های واقعی در R استفاده می کنید. همچنین یاد خواهید گرفت که از بسته های رایج NLP برای استخراج بینش از داده های متنی استفاده کنید.
من حتی شما را با برخی از مطالعات موردی بسیار مهم و کاربردی آشنا خواهم کرد - مانند تشخیص بازپرداخت وام و تشخیص تومور با استفاده از یادگیری ماشین. شما همچنین توییت های مربوط به موضوعات پرطرفدار را استخراج می کنید و احساسات اساسی آنها را تجزیه و تحلیل می کنید و موضوعات را با تخصیص نهفته دیریکله شناسایی می کنید. با این دوره آموزشی قدرتمند All-In-One R Data Science، همه چیز را خواهید دانست: تجسم، آمار، یادگیری ماشین، داده کاوی و شبکه های عصبی!

انگیزه اساسی این دوره این است که اطمینان حاصل شود که می توانید علم داده مبتنی بر R را بر روی داده های واقعی در عمل امروز اعمال کنید. تجزیه و تحلیل داده‌ها را برای پروژه‌های خود، فارغ از سطح مهارت خود، شروع کنید و کارفرمایان بالقوه خود را با نمونه‌های واقعی پروژه‌های علم داده خود تحت تأثیر قرار دهید.

 این چیزی است که دریافت خواهید کرد:

(a) این دوره شما را از سطح پایه به انجام برخی از رایج ترین تکنیک های پیشرفته علم داده با استفاده از ابزارهای قدرتمند مبتنی بر R می برد.

(ب) شما را به استفاده از R برای انجام کارهای مختلف اکتشافی و تجسمی برای مدل‌سازی داده‌ها مجهز می‌کند.

(ج) شما را با برخی از مهمترین مفاهیم یادگیری ماشین به شیوه ای عملی آشنا می کند تا بتوانید این مفاهیم را برای تجزیه و تحلیل و تفسیر داده های عملی به کار ببرید. (د) درکی قوی از برخی از مهم ترین تکنیک های داده کاوی، متن کاوی و پردازش زبان طبیعی خواهید داشت.

(ه) می‌توانید تصمیم بگیرید که کدام تکنیک‌های علم داده برای پاسخ به سؤالات تحقیق شما مناسب‌تر هستند و برای داده‌های شما و تفسیر نتایج قابل استفاده هستند.

به طور خاص، آنچه در این دوره پوشش داده شده است:

  • شروع به کار با R، R Studio و Rattle برای اجرای تکنیک های مختلف علم داده

  • ساختارهای داده و خواندن در پانداها، از جمله داده‌های CSV، Excel، JSON، HTML.

  • چگونه داده‌های R خود را با حذف NA/بدون داده، مدیریت داده‌های شرطی، گروه‌بندی بر اساس ویژگی‌ها و غیره، از قبل پردازش کنید و «مقاله» کنید.

  • ایجاد تجسم داده‌ها مانند هیستوگرام، نمودار جعبه، نمودار پراکنده، بارپلات، نمودار پای/خط، و موارد دیگر

  • تحلیل آماری، استنتاج آماری، و روابط بین متغیرها.

  • یادگیری ماشینی، یادگیری تحت نظارت، یادگیری بدون نظارت در R

  • شبکه های عصبی برای طبقه بندی و رگرسیون

  • خراش دادن وب با استفاده از R

  • استخراج داده های متنی از Twitter و Facebook با استفاده از API

  • متن کاوی

  • تکنیک‌های رایج پردازش زبان طبیعی مانند تحلیل احساسات و مدل‌سازی موضوع

ما مدتی را صرف پرداختن به برخی از مفاهیم نظری مرتبط با علم داده خواهیم کرد. با این حال، اکثر دوره بر پیاده سازی تکنیک های مختلف بر روی داده های واقعی و تفسیر نتایج تمرکز می کند.

بعد از هر ویدیو، مفهوم یا تکنیک جدیدی را یاد خواهید گرفت که می توانید آن را در پروژه های خود به کار ببرید.

همه داده ها و کدهای استفاده شده در دوره به صورت رایگان در دسترس قرار گرفته است و شما می توانید هر طور که دوست دارید از آن استفاده کنید. همچنین به سخنرانی های اضافی که در آینده به صورت رایگان اضافه می شوند دسترسی خواهید داشت.

همین حالا به دوره بپیوندید!



سرفصل ها و درس ها

مقدمه دوره: مفاهیم کلیدی و ابزار نرم افزار INTRODUCTION TO THE COURSE: The Key Concepts and Software Tools

  • معرفی Introduction

  • داده ها و اسکریپت های دوره Data and Scripts For the Course

  • مقدمه ای بر R و RStudio Introduction to R and RStudio

  • با راتل شروع کنید Start with Rattle

  • عیب یابی برای Rattle Troubleshooting For Rattle

  • نتیجه گیری در بخش 1 Conclusion to Section 1

خواندن داده ها از منابع مختلف در R Reading in Data from Different Sources in R

  • داده ها را از فایل های CSV و Excel بخوانید Read in Data from CSV and Excel Files

  • خواندن داده ها از یک پایگاه داده Read Data from a Database

  • خواندن داده ها از JSON Read Data from JSON

  • داده‌های CSV آنلاین را بخوانید Read in Data from Online CSVs

  • در داده ها از جداول HTML آنلاین - قسمت 1 بخوانید Read in Data from Online HTML Tables-Part 1

  • در داده ها از جداول HTML آنلاین - قسمت 2 بخوانید Read in Data from Online HTML Tables-Part 2

  • داده ها را از منابع دیگر بخوانید Read Data from Other Sources

  • نتیجه گیری در بخش 2 Conclusions to Section 2

تجزیه و تحلیل داده های اکتشافی و تجسم داده ها در R Exploratory Data Analysis and Data Visualization in R

  • حذف NA Remove NAs

  • پاکسازی اطلاعات بیشتر More Data Cleaning

  • تجزیه و تحلیل داده های اکتشافی (EDA): تجسم های اساسی با R Exploratory Data Analysis(EDA): Basic Visualizations with R

  • تجزیه و تحلیل داده های اکتشافی بیشتر با xda More Exploratory Data Analysis with xda

  • مقدمه ای بر dplyr برای خلاصه کردن داده ها - قسمت 1 Introduction to dplyr for Data Summarizing-Part 1

  • مقدمه ای بر dplyr برای خلاصه کردن داده ها - قسمت 2 Introduction to dplyr for Data Summarizing-Part 2

  • کاوش و تجسم داده با dplyr و ggplot2 Data Exploration & Visualization With dplyr & ggplot2

  • تاریخ های پیش پردازش - قسمت 1 Pre-Processing Dates-Part 1

  • تاریخ های پیش پردازش - قسمت 2 Pre-Processing Dates-Part 2

  • رسم داده های زمانی در R Plotting Temporal Data in R

  • در داده های (زمانی) بپیچید Twist in the (Temporal) Data

  • ارتباط بین متغیرهای کمی - نظریه Associations Between Quantitative Variables- Theory

  • تست همبستگی Testing for Correlation

  • رابطه بین متغیرهای اسمی را ارزیابی کنید Evaluate the Relation Between Nominal Variables

  • Cramer's V برای بررسی قدرت ارتباط بین متغیر اسمی Cramer's V for Examining the Strength of Association Between Nominal Variable

  • آزمون بخش 3 Section 3 Quiz

داده کاوی برای الگوها و روابط Data Mining for Patterns and Relationships

  • داده کاوی چیست؟ What is Data Mining?

  • انجمن معدن با Apriori Association Mining with Apriori

  • Apriori با داده های واقعی Apriori with Real Data

  • قوانین را تجسم کنید Visualize the Rules

  • ارتباط معدن با Eclat Association Mining with Eclat

  • Eclat با داده های واقعی Eclat with Real Data

یادگیری ماشین برای علم داده Machine Learning for Data Science

  • تفاوت یادگیری ماشینی با تجزیه و تحلیل داده های آماری چیست؟ How is Machine Learning Different from Statistical Data Analysis?

  • یادگیری ماشینی (ML) درباره چیست؟ برخی از نکات نظری What is Machine Learning (ML) About? Some Theoretical Pointers

طبقه بندی بدون نظارت - R Unsupervised Classification- R

  • K-به معنای خوشه بندی است K-means Clustering

  • فازی K-Means Clustering Fuzzy K-Means Clustering

  • خوشه بندی K-Means وزن دار Weighted K-Means Clustering

  • خوشه بندی سلسله مراتبی در R Hierarchical Clustering in R

  • انتظار-بیشینه سازی (EM) در R Expectation-Maximization (EM) in R

  • از Rattle برای خوشه بندی بدون نظارت استفاده کنید Use Rattle for Unsupervised Clustering

  • نتیجه گیری در بخش 6 Conclusions to Section 6

  • آزمون بخش 6 Section 6 Quiz

کاهش ابعاد Dimension Reduction

  • تئوری کاهش ابعاد Dimensionality Reduction-theory

  • PCA PCA

  • حذف متغیرهای پیش بینی کننده بسیار همبسته Removing Highly Correlated Predictor Variables

  • انتخاب متغیر با استفاده از رگرسیون LASSO Variable Selection Using LASSO Regression

  • انتخاب متغیر با FSelector Variable Selection With FSelector

  • تجزیه و تحلیل Boruta برای انتخاب ویژگی Boruta Analysis for Feature Selection

  • نتیجه گیری در بخش 7 Conclusions to Section 7

  • آزمون بخش 7 Section 7 Quiz

تئوری یادگیری تحت نظارت Supervised Learning Theory

  • برخی از مفاهیم اساسی یادگیری تحت نظارت Some Basic Supervised Learning Concepts

  • پیش پردازش برای یادگیری تحت نظارت Pre-processing for Supervised Learning

یادگیری تحت نظارت: طبقه بندی Supervised Learning: Classification

  • طبقه بندی باینری Binary Classification

  • GLM چیست؟ What are GLMs?

  • مدل های رگرسیون لجستیک به عنوان طبقه بندی کننده های باینری Logistic Regression Models as Binary Classifiers

  • تجزیه و تحلیل تشخیص خطی (LDA) Linear Discriminant Analysis (LDA)

  • طبقه بندی باینری با PCA Binary Classifier with PCA

  • معیارهای دقت طبقه بندی باینری را بدست آورید Obtain Binary Classification Accuracy Metrics

  • مدل های طبقه بندی چند طبقه Multi-class Classification Models

  • مشکل طبقه بندی چند کلاسه ما Our Multi-class Classification Problem

  • درختان طبقه بندی Classification Trees

  • بیشتر در مورد تجسم درخت طبقه بندی More on Classification Tree Visualization

  • درختان تصمیم Decision Trees

  • طبقه بندی جنگل تصادفی (RF). Random Forest (RF) classification

  • اهمیت متغیر فردی را برای جنگل های تصادفی بررسی کنید Examine Individual Variable Importance for Random Forests

  • طبقه بندی GBM GBM Classification

  • ماشین‌های بردار پشتیبانی (SVM) برای طبقه‌بندی Support Vector Machines (SVM) for Classification

  • SVM بیشتر برای طبقه بندی More SVM for Classification

  • نتیجه گیری در بخش 9 Conclusions to Section 9

  • آزمون بخش 9 Section 9 Quiz

یادگیری تحت نظارت: رگرسیون Supervised Learning: Regression

  • رگرسیون ریج در R Ridge Regression in R

  • رگرسیون LASSO در R LASSO Regression in R

  • مدل های افزایشی تعمیم یافته (GAMs) در R Generalized Additive Models (GAMs) in R

  • GAM های تقویت شده Boosted GAMs

  • رگرسیون مریخ MARS Regression

  • CART-Rregression Trees در R CART-Regression Trees in R

  • رگرسیون جنگل تصادفی (RF). Random Forest (RF) Regression

  • رگرسیون GBM GBM Regression

  • مقایسه مدل ها Compare Models

  • نتیجه گیری در بخش 10 Conclusions to Section 10

مقدمه ای بر شبکه های عصبی مصنوعی (ANN) Introduction to Artificial Neural Networks (ANN)

  • شبکه های عصبی مصنوعی چیست؟ What are Artificial Neural Networks?

  • شبکه عصبی برای طبقه بندی های باینری Neural Network for Binary Classifications

  • شبکه عصبی با PCA برای طبقه بندی های باینری Neural Network with PCA for Binary Classifications

  • شبکه عصبی برای رگرسیون Neural Network for Regression

  • اطلاعات بیشتر در مورد شبکه های عصبی - با شبکه عصبی More on Neural Networks- with neuralnet

  • شناسایی اهمیت متغیرها در شبکه های عصبی Identify Variable Importance in Neural Networks

استخراج بیشتر وب و داده کاوی متن More Web-scraping and Text Data Mining

  • خواندن داده های متنی از یک صفحه HTML Read in Text Data from an HTML Page

  • آمازون را با R کاوش کنید Explore Amazon with R

  • Webscraping بیشتر با صفحه وب rvest-IMDB More Webscraping With rvest-IMDB Webpage

  • قبل از استخراج داده ها از توییتر Prior to Mining Data from Twitter

  • استخراج توییت ها با استفاده از R Extract Tweets Using R

  • استخراج اطلاعات بیشتر توییتر با استفاده از R More Twitter Data Extraction Using R

  • دریافت اطلاعات از فیس بوک با استفاده از R Get Data from Facebook Using R

  • نتیجه گیری در بخش 12 Conclusions to Section 12

به دست آوردن بینش از داده های متنی- متن کاوی و پردازش زبان طبیعی (NL Gaining Insights from Text Data- Text Mining and Natural Language Processing (NL

  • داده های توییت را کاوش کنید Explore Tweet Data

  • احساس توییت را تجسم کنید Wordcloud- سیاست پولی زدایی هند Visualize Tweet Sentiment Wordcloud- India's Demonetization Policy

  • Wordclouds بیشتر: داده های بررسی آمازون More Wordclouds: Amazon Review Data

  • فرکانس کلمه در داده های متنی Word Frequency in Text Data

  • احساسات توییت - سیاست پولی زدایی هند Tweet Sentiments- India's Demonetization Policy

  • تحلیل احساسات توییت های موگابه Sentiment Analysis of Mugabe Tweets

  • احساسات توییت - برکناری موگابه Tweet Sentiments- Mugabe's Ouster

  • قطبیت متن را بررسی کنید Examine the Polarity of Text

  • قطبیت توییت های فردی Polarity of Individual Tweets

  • موضوع مدلسازی یک سند Topic Modelling a Document

  • موضوع مدل سازی اسناد چندگانه Topic Modelling Multiple Documents

  • نتیجه گیری در بخش 13 Conclusions to Section 13

داده های متنی و یادگیری ماشینی Text Data and Machine Learning

  • EDA با داده های متنی EDA With Text Data

  • بررسی های فریبنده را با طبقه بندی نظارت شده شناسایی کنید Identify Deceptive Reviews With Supervised Classification

  • ایمیل های اسپم را با طبقه بندی نظارت شده شناسایی کنید Identify Spam Emails with Supervised Classification

سخنرانی های متفرقه Miscellaneous Lectures

  • نمودارهای پراکندگی سه بعدی 3D Scatterplots

  • آشنایی با دسکتاپ Github Getting Acquainted with Github Desktop

  • ویرایش داده ها در R Data Editing Within R

  • گروه بر اساس زمان Group By Time

نمایش نظرات

آموزش علم داده: داده کاوی و پردازش زبان طبیعی در R
جزییات دوره
13.5 hours
112
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
3,938
5 از 5
دارد
دارد
دارد
Minerva Singh
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Minerva Singh Minerva Singh

دانشمند تحصیل کرده آکسبریج

سلام. من فارغ التحصیل دکترا از دانشگاه کمبریج هستم که در آنجا در اکولوژی گرمسیری تخصص دارم. من همچنین یک دانشمند داده هستم. به عنوان بخشی از تحقیقاتم، باید تجزیه و تحلیل گسترده داده‌ها، از جمله تجزیه و تحلیل داده‌های مکانی را انجام دهم. یا برای این منظور ترجیح می‌دهم از ترکیبی از ابزارهای رایگان نرم‌افزار R، QGIS و Python استفاده کنم. بیشتر کار تجزیه و تحلیل داده‌های مکانی خود را با استفاده از R انجام می‌دهم. و QGIS. اینها جدا از رایگان بودن، ابزارهای بسیار قدرتمندی برای تجسم، پردازش و تجزیه و تحلیل داده ها هستند. من همچنین دارای مدرک کارشناسی ارشد جغرافیا و محیط زیست از دانشگاه آکسفورد هستم. من مهارت های آماری و تجزیه و تحلیل داده های خود را از طریق تعدادی MOOC از جمله The Analytics Edge (دوره آماری مبتنی بر R و یادگیری ماشین ارائه شده توسط EdX)، یادگیری آماری (دوره یادگیری ماشین مبتنی بر R ارائه شده توسط Standford آنلاین) تقویت کرده ام. علاوه بر تجزیه و تحلیل داده های مکانی، در تجزیه و تحلیل آماری، یادگیری ماشین و داده کاوی نیز مهارت دارم. من همچنین از برنامه نویسی عمومی، تجسم داده ها و توسعه وب لذت می برم. من علاوه بر اینکه یک دانشمند و اعداد شکن هستم، یک مسافر مشتاق هستم