آموزش آماده‌سازی داده با R - آخرین آپدیت

دانلود Data Wrangling in R

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

اصول داده‌های مرتب (Tidy Data) و کاربرد آن در تحلیل داده

فرمت مرتب (Tidy Format)، روشی استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده را فراهم می‌کند. با بهره‌گیری از اصول داده‌های مرتب، آمارگران، تحلیلگران و دانشمندان داده می‌توانند زمان کمتری را صرف پاکسازی داده‌ها و زمان بیشتری را به جنبه‌های جذاب‌تر تحلیل داده اختصاص دهند.

آموزش جامع داده‌های مرتب و پاکسازی داده

در این دوره آموزشی، با اصول داده‌های مرتب آشنا خواهید شد، کشف خواهید کرد که چگونه tibbles داده‌ها را ایجاد و دستکاری کنید و بیاموزید که چگونه از tibbles در وارد کردن، تبدیل و پاکسازی داده‌های خود استفاده کنید.

تسلط بر Data Wrangling با R و tidyverse

مربی Mike Chapple با استفاده از R و پکیج‌های tidyverse، مفهوم Data Wrangling را آموزش می‌دهد. Data Wrangling شامل وظایف پاکسازی داده و تبدیل داده است که بخش قابل توجهی از زمان تحلیلگران را به خود اختصاص می‌دهد.

مطالعات موردی عملی برای تقویت مهارت‌های Data Wrangling

در پایان، سه مطالعه موردی عملی ارائه می‌شود که اصول و تاکتیک‌های Data Wrangling پوشش داده شده در این دوره را تقویت می‌کند. این بخش به شما کمک می‌کند تا مهارت‌های خود را در مدیریت و آماده‌سازی داده برای تحلیل، به طور چشمگیری بهبود بخشید.

کلمات کلیدی مرتبط: داده‌های مرتب، tidy data، تحلیل داده، پاکسازی داده، تبدیل داده، Data Wrangling، R، tidyverse، tibbles، آماده‌سازی داده، علم داده.


سرفصل ها و درس ها

مقدمه Introduction

  • آنچه باید بدانید What you need to know

  • آماده سازی برای پردازش داده‌ها Preparing for data wrangling

  • فایل‌های تمرینی Exercise files

داده‌های مرتب (Tidy Data) 1. Tidy Data

  • مشکلات رایج داده Common data problems

  • متغیرها، مشاهدات، و مقادیر Variables, observations, and values

  • داده مرتب چیست؟ What is tidy data?

  • استفاده از tidyverse Using the tidyverse

2. کار با تیبلز 2. Working with Tibbles

  • ساخت و چاپ تیبل‌ها Building and printing tibbles

  • زیرمجموعه گیری تیبل‌ها Subsetting tibbles

  • فیلتر کردن جدول‌های تیبل Filtering tibbles

3. وارد کردن داده به R 3. Importing Data into R

  • فایل‌های TSV چیستند؟ What are TSV files?

  • وارد کردن فایل‌های با عرض ثابت در R Importing fixed-width files into R

  • فایل‌های CSV چیستند؟ What are CSV files?

  • وارد کردن فایل‌های جدا شده به R Importing delimited files into R

  • وارد کردن فایل‌های اکسل در R Importing Excel files into R

  • وارد کردن فایل‌های CSV در R Importing CSV files into R

  • وارد کردن فایل‌های TSV به R Importing TSV files into R

  • خواندن داده‌ها از پایگاه‌های داده و وب Reading data from databases and the web

۴. تبدیل داده‌ها 4. Data Transformation

  • تبدیل انواع داده در زبان R Converting data types in R

  • تبدیل مجموعه‌داده‌های گسترده به بلند با استفاده از pivot_longer() Making wide datasets long with pivot_longer()

  • تبدیل مجموعه‌داده‌های طولانی به مجموعه‌داده‌های پهن با pivot_wider() Making long datasets wide with pivot_wider()

  • داده‌های گسترده در مقابل داده‌های طولانی Wide vs. long datasets

  • کار با تاریخ و زمان در زبان R Working with dates and times in R

۵. پاکسازی داده‌ها 5. Data Cleaning

  • ادغام ستون‌ها با unite() Combining columns with unite()

  • تجزیه ستون‌ها با `separate()` Breaking apart columns with separate()

  • دستکاری رشته‌ها در R با stringr Manipulating strings in R with stringr

  • مقادیر گمشده و ویژه در R Missing and special values in R

  • تشخیص داده‌های پرت Detecting outliers

6. مطالعه موردی آماده‌سازی داده: مصرف زغال‌سنگ 6. Data Wrangling Case Study: Coal Consumption

  • تجسم مجموعه داده زغال سنگ Visualizing the coal dataset

  • تقسیم‌بندی مجموعه داده زغال‌سنگ Segmenting the coal dataset

  • درک مجموعه داده زغال سنگ Understanding the coal dataset

  • خواندن در مجموعه داده ذغال سنگ Reading in the coal dataset

  • تبدیل مجموعه داده زغال سنگ از فرمت گسترده به فرمت بلند Converting the coal dataset from wide to long

۷. مطالعه موردی دایتا رَنگِلینگ: کیفیت آب 7. Data Wrangling Case Study: Water Quality

  • درک مجموعه داده کیفیت آب Understanding the water quality dataset

  • تبدیل دما از فارنهایت به سانتی‌گراد Converting temperature from Fahrenheit to Celsius

  • گسترش مجموعه داده‌های کیفیت آب Widening the water quality dataset

  • خواندن در مجموعه داده های کیفیت آب Reading in the water quality dataset

  • فیلتر کردن مجموعه داده کیفیت آب Filtering the water quality dataset

  • انواع داده‌های کیفیت آب Water quality data types

  • تصحیح خطاهای ورود داده Correcting data entry errors

  • شناسایی و حذف داده‌های پرت Identifying and removing outliers

۸. مطالعه موردی تمیز کردن داده‌ها: ناتوانی معلولیت تأمین اجتماعی 8. Data Wrangling Case Study: Social Security Disability

  • بلند کردن دیتاست از کارافتادگی تأمین اجتماعی Making the social security disability dataset long

  • تصویرسازی داده‌های ناتوانی تأمین اجتماعی Visualizing the social security disability dataset

  • قالب‌بندی تاریخ در مجموعه داده ناتوانی تأمین اجتماعی Formatting dates in the social security disability dataset

  • واردات مجموعه داده معلولیت تامین اجتماعی Importing the social security disability dataset

  • گسترش مجموعه داده ناتوانی تامین اجتماعی Widening the social security disability dataset

  • درک مجموعه داده ناتوانی تأمین اجتماعی Understanding the social security disability dataset

  • سال‌های مالی در مجموعه داده ناتوانی تأمین اجتماعی Fiscal years in the social security disability dataset

نتیجه‌گیری Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش آماده‌سازی داده با R
جزییات دوره
2h 51m
49
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
14,919
- از 5
دارد
دارد
دارد
Mike Chapple
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mike Chapple Mike Chapple

استاد تدریس در دانشگاه نوتردام

مایک چاپل استاد تدریس فناوری اطلاعات، تجزیه و تحلیل و عملیات در کالج تجارت مندوزا در دانشگاه نوتردام است.



br>در سمت قبلی خود به عنوان مدیر ارشد ارائه خدمات فناوری اطلاعات در دانشگاه نوتردام، او بر امنیت اطلاعات، معماری فناوری اطلاعات، مدیریت پروژه، برنامه ریزی استراتژیک و عملکردهای انطباق با فناوری اطلاعات برای دفتر فناوری اطلاعات نظارت داشت.

مایک یک متخصص امنیت سایبری و تجزیه و تحلیل با بیش از بیست سال تجربه است. او نویسنده بیش از 30 کتاب، از جمله راهنمای مطالعه رسمی (ISC) 2 CISSP و راهنمای مطالعه Sybex از جان وایلی و پسران است که گواهینامه های Security+، CySA+، PenTest+، CISM و CIPP را پوشش می دهد. دوره های آموزشی LinkedIn او طیف گسترده ای از موضوعات مربوط به امنیت سایبری و تجزیه و تحلیل را پوشش می دهد.

درباره برنامه‌های آموزشی امنیت سایبری Mike در CertMike.com اطلاعات بیشتری کسب کنید.