لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پاک کردن داده ها در R با Tidyverse و Data.table
Cleaning Data In R with Tidyverse and Data.table
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
دادههای خود را برای تجزیه و تحلیل با بستههای R tidyverse، dplyr، data.table، tidyr و موارد دیگر آماده کنید. R تشخیص نقاط پرت جداول فیلتر و پرس و جو انتخاب یک کلاس مناسب برای داده های خود کلاس های مختلف داده را پاک کنید (عددی، رشته ای، دسته بندی، عدد صحیح، ...)
به این دوره آموزشی پاکسازی داده ها در R با بسته های Tidyverse، Dplyr، Data.table، Tidyr و بسیاری دیگر خوش آمدید!
شاید از قبل این مشکل را میدانید: دادههای شما قبل از تجزیه و تحلیل به درستی پاک نشدهاند، بنابراین نتایج خراب شدهاند یا حتی نمیتوانید تجزیه و تحلیل را انجام دهید.
به طور خلاصه: شما نمی توانید از بخش تمیز کردن اولیه علم داده فرار کنید. مهم نیست که از کدام داده استفاده می کنید یا کدام تجزیه و تحلیل را می خواهید انجام دهید، پاکسازی داده ها بخشی از فرآیند خواهد بود. بنابراین تصمیم عاقلانه ای است که وقت خود را صرف یادگیری صحیح نحوه انجام این کار کنید.
اکنون همانطور که میتوانید تصور کنید، چیزهای زیادی در دادههای خام اشتباه میکنند. بنابراین مجموعه وسیعی از ابزارها و عملکردها برای مقابله با همه این مسائل مورد نیاز است. مانند همیشه در علم داده، R راه حلی آماده برای هر سناریویی دارد که ممکن است پیش بیاید. تشخیص پرت، انتساب دادههای گمشده، تقسیم ستونها و اتحادها، دستکاری کاراکترها، تبدیل کلاسها و موارد دیگر - همه اینها در R موجود است.
و علاوه بر آن راه های مختلفی وجود دارد که چگونه می توانید همه این کارها را انجام دهید. این بدان معناست که اگر آن را ترجیح می دهید همیشه یک جایگزین دارید. مهم نیست که ابزارهای ساده یا الگوریتم های پیچیده یادگیری ماشینی را برای تمیز کردن داده های خود دوست دارید، R آن را دارد.
اکنون متوجه شدیم که شناسایی ابزارهای مناسب R و استفاده مؤثر از آنها در شروع کار بسیار دشوار است. اما اینجاست که ما به شما کمک خواهیم کرد. در این دوره خواهید دید که کدام ابزارهای R کارآمدترین هستند و چگونه می توانید از آنها استفاده کنید.
با سیستم بسته tidyverse آشنا خواهید شد - مجموعه ای از بسته ها که به عنوان یک تیم برای تولید داده های تمیز با هم کار می کنند. این سیستم به شما در کل فرآیند پاکسازی داده ها از زمان وارد کردن داده ها تا فرآیند پرس و جو داده ها کمک می کند. این یک جعبه ابزار بسیار محبوب است که کاملاً ارزش آن را دارد.
برای فیلتر کردن و جستجوی مجموعه دادهها از ابزارهایی مانند data.table، tibble و dplyr استفاده خواهید کرد.
شما یاد خواهید گرفت که چگونه نقاط پرت را شناسایی کنید و چگونه داده های از دست رفته را جایگزین کنید. ما حتی از الگوریتمهای یادگیری ماشینی برای انجام این کارها استفاده میکنیم.
و برای اطمینان از اینکه می توانید از این ابزارها در کارهای روزانه خود استفاده و پیاده سازی کنید، در پایان دوره یک پروژه پاکسازی داده وجود دارد. در این پروژه شما یک تکلیف دریافت می کنید که می توانید آن را به تنهایی بر اساس مطالبی که در دوره یاد گرفتید حل کنید. بنابراین شما فرصت زیادی برای آزمایش، آموزش و اصلاح مهارت های پاکسازی داده های خود دارید.
مثل همیشه اسکریپت های R را به عنوان متن برای کپی کردن در نمونه RStudio خود دریافت می کنید. و پس از اتمام دوره، گواهی دوره از Udemy دریافت خواهید کرد.
تیم R-Tutorials
سرفصل ها و درس ها
معرفی
Introduction
مقدمه
Intro
چرا داده های تمیز و مرتب برای یک تحلیل موفق ضروری است؟
Why Clean and Tidy Data Is Necessary for a Successful Analysis
چرا R را برای پاکسازی داده ها انتخاب کنیم؟
Why to Choose R for Data Cleaning
چگونه به راحتی داده ها را به R وارد کنیم
How to Easily Import Data into R
بهترین انواع میز در R
Best Table Types in R
معرفی دوره اسکریپت
Script Course Intro
معرفی
Introduction
مقدمه
Intro
چرا داده های تمیز و مرتب برای یک تحلیل موفق ضروری است؟
Why Clean and Tidy Data Is Necessary for a Successful Analysis
چرا R را برای پاکسازی داده ها انتخاب کنیم؟
Why to Choose R for Data Cleaning
چگونه به راحتی داده ها را به R وارد کنیم
How to Easily Import Data into R
بهترین انواع میز در R
Best Table Types in R
معرفی دوره اسکریپت
Script Course Intro
مدیریت ارزش های گمشده و تشخیص موارد پرت
Handling Missing Values And Detecting Outliers
به: مدیریت داده های گمشده و تشخیص موارد دور از دسترس خوش آمدید
Welcome to: Missing Data Handling and Outlier Detection
مقدمه ای بر مدیریت داده های گمشده
Introduction to Missing Data Handling
اسکریپت از دست رفته ارزش ها و نقاط پرت
Script Missing Values and Outliers
روشهای ساده برای مدیریت دادههای از دست رفته
Simple Methods for Missing Data Handling
یادگیری ماشینی برای داده های گمشده
Machine Learning Learning for Missing Data Imputation
پرت آماری
Statistical Outliers
تشخیص نقاط پرت در مجموعه داده های تک متغیره
Detecting Outliers in Univariate Datasets
تشخیص نقاط پرت در مجموعه داده های چند متغیره
Detecting Outliers in Multivariate Datasets
مدیریت ارزش های گمشده و تشخیص موارد پرت
Handling Missing Values And Detecting Outliers
به: مدیریت داده های گمشده و تشخیص موارد دور از دسترس خوش آمدید
Welcome to: Missing Data Handling and Outlier Detection
مقدمه ای بر مدیریت داده های گمشده
Introduction to Missing Data Handling
اسکریپت از دست رفته ارزش ها و نقاط پرت
Script Missing Values and Outliers
روشهای ساده برای مدیریت دادههای از دست رفته
Simple Methods for Missing Data Handling
یادگیری ماشینی برای داده های گمشده
Machine Learning Learning for Missing Data Imputation
پرت آماری
Statistical Outliers
تشخیص نقاط پرت در مجموعه داده های تک متغیره
Detecting Outliers in Univariate Datasets
تشخیص نقاط پرت در مجموعه داده های چند متغیره
Detecting Outliers in Multivariate Datasets
جعبه ابزار Tidyverse برای تمیز کردن کارآمد داده ها
The Tidyverse Toolbox For Efficient Data Cleaning
به: The Tidyverse خوش آمدید
Welcome to: The Tidyverse
Tidyverse چیست؟
What Is the Tidyverse?
اسکریپت Tidyverse
Script Tidyverse
با استفاده از اپراتور لوله
Using the Pipe Operator
کاوش در تیبل
Exploring the Tibble
داده های مرتب به عنوان اصل اساسی Tidyverse
Tidy Data as the Underlying Principle of the Tidyverse
تغییر فرمت های جدول
Changing Table Formats
نحوه تقسیم ستون ها
How to split Columns
تبدیل از فرمت طولانی به گسترده
Converting from Long to Wide Format
دستکاری رشته ها با Stringr
String Manipulations with Stringr
جعبه ابزار Tidyverse برای تمیز کردن کارآمد داده ها
The Tidyverse Toolbox For Efficient Data Cleaning
به: The Tidyverse خوش آمدید
Welcome to: The Tidyverse
Tidyverse چیست؟
What Is the Tidyverse?
اسکریپت Tidyverse
Script Tidyverse
با استفاده از اپراتور لوله
Using the Pipe Operator
کاوش در تیبل
Exploring the Tibble
داده های مرتب به عنوان اصل اساسی Tidyverse
Tidy Data as the Underlying Principle of the Tidyverse
تغییر فرمت های جدول
Changing Table Formats
نحوه تقسیم ستون ها
How to split Columns
تبدیل از فرمت طولانی به گسترده
Converting from Long to Wide Format
دستکاری رشته ها با Stringr
String Manipulations with Stringr
زیرمجموعه، فیلتر کردن و پرس و جو با data.frame، داده ها، جدول و tibble
Subsetting, Filtering And Queries With data.frame, data,table And tibble
به: Query Systems در R خوش آمدید
Welcome to: Query Systems in R
پرس و جوهای اسکریپت
Script Queries
فیلترینگ و پرس و جو - پیشینه عمومی
Filtering and Querying - General Background
استفاده از dplyr برای Queries
Using dplyr for Queries
جستارهایی با "data.table"
Queries with 'data.table'
زیرمجموعه، فیلتر کردن و پرس و جو با data.frame، داده ها، جدول و tibble
Subsetting, Filtering And Queries With data.frame, data,table And tibble
به: Query Systems در R خوش آمدید
Welcome to: Query Systems in R
پرس و جوهای اسکریپت
Script Queries
فیلترینگ و پرس و جو - پیشینه عمومی
Filtering and Querying - General Background
استفاده از dplyr برای Queries
Using dplyr for Queries
جستارهایی با "data.table"
Queries with 'data.table'
پروژه دوره - آنچه را که یاد گرفتید بر روی داده های دنیای واقعی اعمال کنید
Course Project - Apply What You Learned On Real World Data
به: پروژه دوره بزرگ خوش آمدید
Welcome to: The Great Course Project
داده های پروژه - داده ها را از اینجا دریافت کنید!
Project Data - Get the Data here!
واگذاری پروژه
Project Assignment
پروژه دوره اسکریپت
Script Course Project
راه حل: واردات داده
Solution: Data Import
راه حل: پاکسازی داده ها
Solution: Data Cleaning
راه حل: پرس و جو
Solution: Querying
خلاصه دوره
Course Summary
پروژه دوره - آنچه را که یاد گرفتید بر روی داده های دنیای واقعی اعمال کنید
Course Project - Apply What You Learned On Real World Data
به: پروژه دوره بزرگ خوش آمدید
Welcome to: The Great Course Project
داده های پروژه - داده ها را از اینجا دریافت کنید!
Project Data - Get the Data here!
R-Tutorials Data Science Education ارائه دهنده انتخاب شما در زمینه دوره های آموزشی تجزیه و تحلیل است! آن را امتحان کنید - 100000+ دانش آموز ما آن را دوست دارند.
ما بر روی آموزشهای Science Data تمرکز می کنیم. با ارائه چندین دوره R برای هر سطح مهارت ، ما از بهترین ارائه دهندگان آموزش R Udemy هستیم. در بالای این دوره ها در Tableau ، Excel و یک راهنمای شغلی Data Science در دسترس است.
همه دوره های ما شامل تمریناتی است که به شما این فرصت را می دهد تا بتوانید مطالب را به تنهایی امتحان کنید. همچنین برای مرور مجدد دروس ، pdf اسکریپت قابل بارگیری دریافت خواهید کرد.
این دوره ها توسط مربی اصلی ما مارتین آموزش داده می شود - متخصص آمار و دانشمند مشتاق داده اطلاعات / کاربر تحقیق.
در صورت داشتن هر گونه سوال ، از شما دعوت می شود وب سایت ما را بررسی کنید ، می توانید در این دوره بحث کنید یا می توانید یک بعد از ظهر ما را رها کنید.
ما اینجا هستیم تا با آموزش تجزیه و تحلیل به شما کمک کنیم حرفه خود را تقویت کنید - فقط یاد بگیرید و لذت ببرید.
نمایش نظرات