آموزش پاک کردن داده ها در R با Tidyverse و Data.table

Cleaning Data In R with Tidyverse and Data.table

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: داده‌های خود را برای تجزیه و تحلیل با بسته‌های R tidyverse، dplyr، data.table، tidyr و موارد دیگر آماده کنید. R تشخیص نقاط پرت جداول فیلتر و پرس و جو انتخاب یک کلاس مناسب برای داده های خود کلاس های مختلف داده را پاک کنید (عددی، رشته ای، دسته بندی، عدد صحیح، ...)

به این دوره آموزشی پاکسازی داده ها در R با بسته های Tidyverse، Dplyr، Data.table، Tidyr و بسیاری دیگر خوش آمدید!

شاید از قبل این مشکل را می‌دانید: داده‌های شما قبل از تجزیه و تحلیل به درستی پاک نشده‌اند، بنابراین نتایج خراب شده‌اند یا حتی نمی‌توانید تجزیه و تحلیل را انجام دهید.

به طور خلاصه: شما نمی توانید از بخش تمیز کردن اولیه علم داده فرار کنید. مهم نیست که از کدام داده استفاده می کنید یا کدام تجزیه و تحلیل را می خواهید انجام دهید، پاکسازی داده ها بخشی از فرآیند خواهد بود. بنابراین تصمیم عاقلانه ای است که وقت خود را صرف یادگیری صحیح نحوه انجام این کار کنید.

اکنون همانطور که می‌توانید تصور کنید، چیزهای زیادی در داده‌های خام اشتباه می‌کنند. بنابراین مجموعه وسیعی از ابزارها و عملکردها برای مقابله با همه این مسائل مورد نیاز است. مانند همیشه در علم داده، R راه حلی آماده برای هر سناریویی دارد که ممکن است پیش بیاید. تشخیص پرت، انتساب داده‌های گمشده، تقسیم ستون‌ها و اتحادها، دستکاری کاراکترها، تبدیل کلاس‌ها و موارد دیگر - همه این‌ها در R موجود است.

و علاوه بر آن راه های مختلفی وجود دارد که چگونه می توانید همه این کارها را انجام دهید. این بدان معناست که اگر آن را ترجیح می دهید همیشه یک جایگزین دارید. مهم نیست که ابزارهای ساده یا الگوریتم های پیچیده یادگیری ماشینی را برای تمیز کردن داده های خود دوست دارید، R آن را دارد.

اکنون متوجه شدیم که شناسایی ابزارهای مناسب R و استفاده مؤثر از آنها در شروع کار بسیار دشوار است. اما اینجاست که ما به شما کمک خواهیم کرد. در این دوره خواهید دید که کدام ابزارهای R کارآمدترین هستند و چگونه می توانید از آنها استفاده کنید.

با سیستم بسته tidyverse آشنا خواهید شد - مجموعه ای از بسته ها که به عنوان یک تیم برای تولید داده های تمیز با هم کار می کنند. این سیستم به شما در کل فرآیند پاکسازی داده ها از زمان وارد کردن داده ها تا فرآیند پرس و جو داده ها کمک می کند. این یک جعبه ابزار بسیار محبوب است که کاملاً ارزش آن را دارد.

برای فیلتر کردن و جستجوی مجموعه داده‌ها از ابزارهایی مانند data.table، tibble و dplyr استفاده خواهید کرد.

شما یاد خواهید گرفت که چگونه نقاط پرت را شناسایی کنید و چگونه داده های از دست رفته را جایگزین کنید. ما حتی از الگوریتم‌های یادگیری ماشینی برای انجام این کارها استفاده می‌کنیم.

و برای اطمینان از اینکه می توانید از این ابزارها در کارهای روزانه خود استفاده و پیاده سازی کنید، در پایان دوره یک پروژه پاکسازی داده وجود دارد. در این پروژه شما یک تکلیف دریافت می کنید که می توانید آن را به تنهایی بر اساس مطالبی که در دوره یاد گرفتید حل کنید. بنابراین شما فرصت زیادی برای آزمایش، آموزش و اصلاح مهارت های پاکسازی داده های خود دارید.

مثل همیشه اسکریپت های R را به عنوان متن برای کپی کردن در نمونه RStudio خود دریافت می کنید. و پس از اتمام دوره، گواهی دوره از Udemy دریافت خواهید کرد.

تیم R-Tutorials



سرفصل ها و درس ها

معرفی Introduction

  • مقدمه Intro

  • چرا داده های تمیز و مرتب برای یک تحلیل موفق ضروری است؟ Why Clean and Tidy Data Is Necessary for a Successful Analysis

  • چرا R را برای پاکسازی داده ها انتخاب کنیم؟ Why to Choose R for Data Cleaning

  • چگونه به راحتی داده ها را به R وارد کنیم How to Easily Import Data into R

  • بهترین انواع میز در R Best Table Types in R

  • معرفی دوره اسکریپت Script Course Intro

معرفی Introduction

  • مقدمه Intro

  • چرا داده های تمیز و مرتب برای یک تحلیل موفق ضروری است؟ Why Clean and Tidy Data Is Necessary for a Successful Analysis

  • چرا R را برای پاکسازی داده ها انتخاب کنیم؟ Why to Choose R for Data Cleaning

  • چگونه به راحتی داده ها را به R وارد کنیم How to Easily Import Data into R

  • بهترین انواع میز در R Best Table Types in R

  • معرفی دوره اسکریپت Script Course Intro

مدیریت ارزش های گمشده و تشخیص موارد پرت Handling Missing Values And Detecting Outliers

  • به: مدیریت داده های گمشده و تشخیص موارد دور از دسترس خوش آمدید Welcome to: Missing Data Handling and Outlier Detection

  • مقدمه ای بر مدیریت داده های گمشده Introduction to Missing Data Handling

  • اسکریپت از دست رفته ارزش ها و نقاط پرت Script Missing Values and Outliers

  • روش‌های ساده برای مدیریت داده‌های از دست رفته Simple Methods for Missing Data Handling

  • یادگیری ماشینی برای داده های گمشده Machine Learning Learning for Missing Data Imputation

  • پرت آماری Statistical Outliers

  • تشخیص نقاط پرت در مجموعه داده های تک متغیره Detecting Outliers in Univariate Datasets

  • تشخیص نقاط پرت در مجموعه داده های چند متغیره Detecting Outliers in Multivariate Datasets

مدیریت ارزش های گمشده و تشخیص موارد پرت Handling Missing Values And Detecting Outliers

  • به: مدیریت داده های گمشده و تشخیص موارد دور از دسترس خوش آمدید Welcome to: Missing Data Handling and Outlier Detection

  • مقدمه ای بر مدیریت داده های گمشده Introduction to Missing Data Handling

  • اسکریپت از دست رفته ارزش ها و نقاط پرت Script Missing Values and Outliers

  • روش‌های ساده برای مدیریت داده‌های از دست رفته Simple Methods for Missing Data Handling

  • یادگیری ماشینی برای داده های گمشده Machine Learning Learning for Missing Data Imputation

  • پرت آماری Statistical Outliers

  • تشخیص نقاط پرت در مجموعه داده های تک متغیره Detecting Outliers in Univariate Datasets

  • تشخیص نقاط پرت در مجموعه داده های چند متغیره Detecting Outliers in Multivariate Datasets

جعبه ابزار Tidyverse برای تمیز کردن کارآمد داده ها The Tidyverse Toolbox For Efficient Data Cleaning

  • به: The Tidyverse خوش آمدید Welcome to: The Tidyverse

  • Tidyverse چیست؟ What Is the Tidyverse?

  • اسکریپت Tidyverse Script Tidyverse

  • با استفاده از اپراتور لوله Using the Pipe Operator

  • کاوش در تیبل Exploring the Tibble

  • داده های مرتب به عنوان اصل اساسی Tidyverse Tidy Data as the Underlying Principle of the Tidyverse

  • تغییر فرمت های جدول Changing Table Formats

  • نحوه تقسیم ستون ها How to split Columns

  • تبدیل از فرمت طولانی به گسترده Converting from Long to Wide Format

  • دستکاری رشته ها با Stringr String Manipulations with Stringr

جعبه ابزار Tidyverse برای تمیز کردن کارآمد داده ها The Tidyverse Toolbox For Efficient Data Cleaning

  • به: The Tidyverse خوش آمدید Welcome to: The Tidyverse

  • Tidyverse چیست؟ What Is the Tidyverse?

  • اسکریپت Tidyverse Script Tidyverse

  • با استفاده از اپراتور لوله Using the Pipe Operator

  • کاوش در تیبل Exploring the Tibble

  • داده های مرتب به عنوان اصل اساسی Tidyverse Tidy Data as the Underlying Principle of the Tidyverse

  • تغییر فرمت های جدول Changing Table Formats

  • نحوه تقسیم ستون ها How to split Columns

  • تبدیل از فرمت طولانی به گسترده Converting from Long to Wide Format

  • دستکاری رشته ها با Stringr String Manipulations with Stringr

زیرمجموعه، فیلتر کردن و پرس و جو با data.frame، داده ها، جدول و tibble Subsetting, Filtering And Queries With data.frame, data,table And tibble

  • به: Query Systems در R خوش آمدید Welcome to: Query Systems in R

  • پرس و جوهای اسکریپت Script Queries

  • فیلترینگ و پرس و جو - پیشینه عمومی Filtering and Querying - General Background

  • استفاده از dplyr برای Queries Using dplyr for Queries

  • جستارهایی با "data.table" Queries with 'data.table'

زیرمجموعه، فیلتر کردن و پرس و جو با data.frame، داده ها، جدول و tibble Subsetting, Filtering And Queries With data.frame, data,table And tibble

  • به: Query Systems در R خوش آمدید Welcome to: Query Systems in R

  • پرس و جوهای اسکریپت Script Queries

  • فیلترینگ و پرس و جو - پیشینه عمومی Filtering and Querying - General Background

  • استفاده از dplyr برای Queries Using dplyr for Queries

  • جستارهایی با "data.table" Queries with 'data.table'

پروژه دوره - آنچه را که یاد گرفتید بر روی داده های دنیای واقعی اعمال کنید Course Project - Apply What You Learned On Real World Data

  • به: پروژه دوره بزرگ خوش آمدید Welcome to: The Great Course Project

  • داده های پروژه - داده ها را از اینجا دریافت کنید! Project Data - Get the Data here!

  • واگذاری پروژه Project Assignment

  • پروژه دوره اسکریپت Script Course Project

  • راه حل: واردات داده Solution: Data Import

  • راه حل: پاکسازی داده ها Solution: Data Cleaning

  • راه حل: پرس و جو Solution: Querying

  • خلاصه دوره Course Summary

پروژه دوره - آنچه را که یاد گرفتید بر روی داده های دنیای واقعی اعمال کنید Course Project - Apply What You Learned On Real World Data

  • به: پروژه دوره بزرگ خوش آمدید Welcome to: The Great Course Project

  • داده های پروژه - داده ها را از اینجا دریافت کنید! Project Data - Get the Data here!

  • واگذاری پروژه Project Assignment

  • پروژه دوره اسکریپت Script Course Project

  • راه حل: واردات داده Solution: Data Import

  • راه حل: پاکسازی داده ها Solution: Data Cleaning

  • راه حل: پرس و جو Solution: Querying

  • خلاصه دوره Course Summary

نمایش نظرات

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.

آموزش پاک کردن داده ها در R با Tidyverse و Data.table
جزییات دوره
4 hours
37
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
2,448
4.6 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

R-Tutorials Training R-Tutorials Training

R-Tutorials Data Science Education ارائه دهنده انتخاب شما در زمینه دوره های آموزشی تجزیه و تحلیل است! آن را امتحان کنید - 100000+ دانش آموز ما آن را دوست دارند. ما بر روی آموزشهای Science Data تمرکز می کنیم. با ارائه چندین دوره R برای هر سطح مهارت ، ما از بهترین ارائه دهندگان آموزش R Udemy هستیم. در بالای این دوره ها در Tableau ، Excel و یک راهنمای شغلی Data Science در دسترس است. همه دوره های ما شامل تمریناتی است که به شما این فرصت را می دهد تا بتوانید مطالب را به تنهایی امتحان کنید. همچنین برای مرور مجدد دروس ، pdf اسکریپت قابل بارگیری دریافت خواهید کرد. این دوره ها توسط مربی اصلی ما مارتین آموزش داده می شود - متخصص آمار و دانشمند مشتاق داده اطلاعات / کاربر تحقیق. در صورت داشتن هر گونه سوال ، از شما دعوت می شود وب سایت ما را بررسی کنید ، می توانید در این دوره بحث کنید یا می توانید یک بعد از ظهر ما را رها کنید. ما اینجا هستیم تا با آموزش تجزیه و تحلیل به شما کمک کنیم حرفه خود را تقویت کنید - فقط یاد بگیرید و لذت ببرید.