آموزش آماده‌سازی داده با R - آخرین آپدیت

دانلود Data Wrangling in R

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره:

اصول داده‌های مرتب (Tidy Data) و کاربرد آن در تحلیل داده

فرمت مرتب (Tidy Format)، روشی استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده را فراهم می‌کند. با بهره‌گیری از اصول داده‌های مرتب، آمارگران، تحلیلگران و دانشمندان داده می‌توانند زمان کمتری را صرف پاکسازی داده‌ها و زمان بیشتری را به جنبه‌های جذاب‌تر تحلیل داده اختصاص دهند.

آموزش جامع داده‌های مرتب و پاکسازی داده

در این دوره آموزشی، با اصول داده‌های مرتب آشنا خواهید شد، کشف خواهید کرد که چگونه tibbles داده‌ها را ایجاد و دستکاری کنید و بیاموزید که چگونه از tibbles در وارد کردن، تبدیل و پاکسازی داده‌های خود استفاده کنید.

تسلط بر Data Wrangling با R و tidyverse

مربی Mike Chapple با استفاده از R و پکیج‌های tidyverse، مفهوم Data Wrangling را آموزش می‌دهد. Data Wrangling شامل وظایف پاکسازی داده و تبدیل داده است که بخش قابل توجهی از زمان تحلیلگران را به خود اختصاص می‌دهد.

مطالعات موردی عملی برای تقویت مهارت‌های Data Wrangling

در پایان، سه مطالعه موردی عملی ارائه می‌شود که اصول و تاکتیک‌های Data Wrangling پوشش داده شده در این دوره را تقویت می‌کند. این بخش به شما کمک می‌کند تا مهارت‌های خود را در مدیریت و آماده‌سازی داده برای تحلیل، به طور چشمگیری بهبود بخشید.

کلمات کلیدی مرتبط: داده‌های مرتب، tidy data، تحلیل داده، پاکسازی داده، تبدیل داده، Data Wrangling، R، tidyverse، tibbles، آماده‌سازی داده، علم داده.

سرفصل ها و درس ها

مقدمه Introduction

آنچه باید بدانید What you need to know
آماده سازی برای پردازش داده‌ها Preparing for data wrangling
فایل‌های تمرینی Exercise files

داده‌های مرتب (Tidy Data) 1. Tidy Data

مشکلات رایج داده Common data problems
متغیرها، مشاهدات، و مقادیر Variables, observations, and values
داده مرتب چیست؟ What is tidy data?
استفاده از tidyverse Using the tidyverse

2. کار با تیبلز 2. Working with Tibbles

ساخت و چاپ تیبل‌ها Building and printing tibbles
زیرمجموعه گیری تیبل‌ها Subsetting tibbles
فیلتر کردن جدول‌های تیبل Filtering tibbles

3. وارد کردن داده به R 3. Importing Data into R

فایل‌های TSV چیستند؟ What are TSV files?
وارد کردن فایل‌های با عرض ثابت در R Importing fixed-width files into R
فایل‌های CSV چیستند؟ What are CSV files?
وارد کردن فایل‌های جدا شده به R Importing delimited files into R
وارد کردن فایل‌های اکسل در R Importing Excel files into R
وارد کردن فایل‌های CSV در R Importing CSV files into R
وارد کردن فایل‌های TSV به R Importing TSV files into R
خواندن داده‌ها از پایگاه‌های داده و وب Reading data from databases and the web

۴. تبدیل داده‌ها 4. Data Transformation

تبدیل انواع داده در زبان R Converting data types in R
تبدیل مجموعه‌داده‌های گسترده به بلند با استفاده از pivot_longer() Making wide datasets long with pivot_longer()
تبدیل مجموعه‌داده‌های طولانی به مجموعه‌داده‌های پهن با pivot_wider() Making long datasets wide with pivot_wider()
داده‌های گسترده در مقابل داده‌های طولانی Wide vs. long datasets
کار با تاریخ و زمان در زبان R Working with dates and times in R

۵. پاکسازی داده‌ها 5. Data Cleaning

ادغام ستون‌ها با unite() Combining columns with unite()
تجزیه ستون‌ها با `separate()` Breaking apart columns with separate()
دستکاری رشته‌ها در R با stringr Manipulating strings in R with stringr
مقادیر گمشده و ویژه در R Missing and special values in R
تشخیص داده‌های پرت Detecting outliers

6. مطالعه موردی آماده‌سازی داده: مصرف زغال‌سنگ 6. Data Wrangling Case Study: Coal Consumption

تجسم مجموعه داده زغال سنگ Visualizing the coal dataset
تقسیم‌بندی مجموعه داده زغال‌سنگ Segmenting the coal dataset
درک مجموعه داده زغال سنگ Understanding the coal dataset
خواندن در مجموعه داده ذغال سنگ Reading in the coal dataset
تبدیل مجموعه داده زغال سنگ از فرمت گسترده به فرمت بلند Converting the coal dataset from wide to long

۷. مطالعه موردی دایتا رَنگِلینگ: کیفیت آب 7. Data Wrangling Case Study: Water Quality

درک مجموعه داده کیفیت آب Understanding the water quality dataset
تبدیل دما از فارنهایت به سانتی‌گراد Converting temperature from Fahrenheit to Celsius
گسترش مجموعه داده‌های کیفیت آب Widening the water quality dataset
خواندن در مجموعه داده های کیفیت آب Reading in the water quality dataset
فیلتر کردن مجموعه داده کیفیت آب Filtering the water quality dataset
انواع داده‌های کیفیت آب Water quality data types
تصحیح خطاهای ورود داده Correcting data entry errors
شناسایی و حذف داده‌های پرت Identifying and removing outliers

۸. مطالعه موردی تمیز کردن داده‌ها: ناتوانی معلولیت تأمین اجتماعی 8. Data Wrangling Case Study: Social Security Disability

بلند کردن دیتاست از کارافتادگی تأمین اجتماعی Making the social security disability dataset long
تصویرسازی داده‌های ناتوانی تأمین اجتماعی Visualizing the social security disability dataset
قالب‌بندی تاریخ در مجموعه داده ناتوانی تأمین اجتماعی Formatting dates in the social security disability dataset
واردات مجموعه داده معلولیت تامین اجتماعی Importing the social security disability dataset
گسترش مجموعه داده ناتوانی تامین اجتماعی Widening the social security disability dataset
درک مجموعه داده ناتوانی تأمین اجتماعی Understanding the social security disability dataset
سال‌های مالی در مجموعه داده ناتوانی تأمین اجتماعی Fiscal years in the social security disability dataset

نتیجه‌گیری Conclusion

مراحل بعدی Next steps

برای ارسال نظر ثبت نام کنید.

آموزش آماده‌سازی داده با R - آخرین آپدیت

دانلود Data Wrangling in R

اصول داده‌های مرتب (Tidy Data) و کاربرد آن در تحلیل داده

آموزش جامع داده‌های مرتب و پاکسازی داده

تسلط بر Data Wrangling با R و tidyverse

مطالعات موردی عملی برای تقویت مهارت‌های Data Wrangling

مقدمه Introduction

آنچه باید بدانید What you need to know

آماده سازی برای پردازش داده‌ها Preparing for data wrangling

فایل‌های تمرینی Exercise files

داده‌های مرتب (Tidy Data) 1. Tidy Data

مشکلات رایج داده Common data problems

متغیرها، مشاهدات، و مقادیر Variables, observations, and values

داده مرتب چیست؟ What is tidy data?

استفاده از tidyverse Using the tidyverse

2. کار با تیبلز 2. Working with Tibbles

ساخت و چاپ تیبل‌ها Building and printing tibbles

زیرمجموعه گیری تیبل‌ها Subsetting tibbles

فیلتر کردن جدول‌های تیبل Filtering tibbles

3. وارد کردن داده به R 3. Importing Data into R

فایل‌های TSV چیستند؟ What are TSV files?

وارد کردن فایل‌های با عرض ثابت در R Importing fixed-width files into R

فایل‌های CSV چیستند؟ What are CSV files?

وارد کردن فایل‌های جدا شده به R Importing delimited files into R

وارد کردن فایل‌های اکسل در R Importing Excel files into R

وارد کردن فایل‌های CSV در R Importing CSV files into R

وارد کردن فایل‌های TSV به R Importing TSV files into R

خواندن داده‌ها از پایگاه‌های داده و وب Reading data from databases and the web

۴. تبدیل داده‌ها 4. Data Transformation

تبدیل انواع داده در زبان R Converting data types in R

تبدیل مجموعه‌داده‌های گسترده به بلند با استفاده از pivot_longer() Making wide datasets long with pivot_longer()

تبدیل مجموعه‌داده‌های طولانی به مجموعه‌داده‌های پهن با pivot_wider() Making long datasets wide with pivot_wider()

داده‌های گسترده در مقابل داده‌های طولانی Wide vs. long datasets

کار با تاریخ و زمان در زبان R Working with dates and times in R

۵. پاکسازی داده‌ها 5. Data Cleaning

ادغام ستون‌ها با unite() Combining columns with unite()

تجزیه ستون‌ها با `separate()` Breaking apart columns with separate()

دستکاری رشته‌ها در R با stringr Manipulating strings in R with stringr

مقادیر گمشده و ویژه در R Missing and special values in R

تشخیص داده‌های پرت Detecting outliers

6. مطالعه موردی آماده‌سازی داده: مصرف زغال‌سنگ 6. Data Wrangling Case Study: Coal Consumption

تجسم مجموعه داده زغال سنگ Visualizing the coal dataset

تقسیم‌بندی مجموعه داده زغال‌سنگ Segmenting the coal dataset

درک مجموعه داده زغال سنگ Understanding the coal dataset

خواندن در مجموعه داده ذغال سنگ Reading in the coal dataset

تبدیل مجموعه داده زغال سنگ از فرمت گسترده به فرمت بلند Converting the coal dataset from wide to long

۷. مطالعه موردی دایتا رَنگِلینگ: کیفیت آب 7. Data Wrangling Case Study: Water Quality

درک مجموعه داده کیفیت آب Understanding the water quality dataset

تبدیل دما از فارنهایت به سانتی‌گراد Converting temperature from Fahrenheit to Celsius

گسترش مجموعه داده‌های کیفیت آب Widening the water quality dataset

خواندن در مجموعه داده های کیفیت آب Reading in the water quality dataset

فیلتر کردن مجموعه داده کیفیت آب Filtering the water quality dataset

انواع داده‌های کیفیت آب Water quality data types

تصحیح خطاهای ورود داده Correcting data entry errors

شناسایی و حذف داده‌های پرت Identifying and removing outliers

۸. مطالعه موردی تمیز کردن داده‌ها: ناتوانی معلولیت تأمین اجتماعی 8. Data Wrangling Case Study: Social Security Disability

بلند کردن دیتاست از کارافتادگی تأمین اجتماعی Making the social security disability dataset long

تصویرسازی داده‌های ناتوانی تأمین اجتماعی Visualizing the social security disability dataset

قالب‌بندی تاریخ در مجموعه داده ناتوانی تأمین اجتماعی Formatting dates in the social security disability dataset

واردات مجموعه داده معلولیت تامین اجتماعی Importing the social security disability dataset

گسترش مجموعه داده ناتوانی تامین اجتماعی Widening the social security disability dataset

درک مجموعه داده ناتوانی تأمین اجتماعی Understanding the social security disability dataset

سال‌های مالی در مجموعه داده ناتوانی تأمین اجتماعی Fiscal years in the social security disability dataset

نتیجه‌گیری Conclusion

مراحل بعدی Next steps

نمایش نظرات

https://donyad.com/d/5578fc