آموزش کنار آمدن با داده های مفقود شده ، نامعتبر و تکراری در R

Coping with Missing, Invalid, and Duplicate Data in R

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: درباره مهمترین مراحل آماده سازی داده ها بیاموزید: محاسبه ارزش از دست رفته ، تشخیص مجزا و حذف تکراری. این دوره بخشی از موارد زیر است: پاک کردن داده ها با R Rath همه را بزرگ کنید بررسی اجمالی دوره 1m 56s مدیریت داده های تکراری 28 متر 43s مدیریت داده های از دست رفته 37 متر 54s تشخیص داده دور از دسترس و نامعتبر 37 متر 52s منابع و خلاصه بیشتر 14 متر 35s علائم تجاری و نام تجاری اشخاص ثالث ذکر شده در این دوره متعلق به صاحبان مربوطه می باشند و Pluralsight وابسته یا تأیید شده توسط این احزاب نیست.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

مدیریت داده های تکراری Managing Duplicate Data

  • معرفی Intro

  • مدیریت انتظارات Managing Expectations

  • مجموعه داده های دوره Course Dataset

  • وارد کردن داده Data Import

  • عوامل در مقابل داده های کاراکتر Factors vs. Character Data

  • جانشینی مراحل در پیش پردازش داده ها Succession of Steps in Data Pre-processing

  • داده ها را در R Base و dplyr کپی کنید Duplicate Data in R Base and dplyr

  • خلاصه Summary

مدیریت داده های از دست رفته Managing Missing Data

  • معرفی Intro

  • درک ارزش های از دست رفته Understanding Missing Values

  • روشهای سریع و ساده برای از دست دادن مقادیر Quick and Simple Methods for Missing Values

  • روشهای ورودی Imputation Methods

  • استفاده از visdat برای تجسم NA Using visdat for NA Visualizations

  • MICE برای ارزشهای گمشده MICE for Missing Values

  • یادگیری ماشینی برای ارزش های از دست رفته Machine Learning for Missing Values

  • کار روی مجموعه داده کارپارت Working on the Carparts Dataset

  • خلاصه Summary

تشخیص داده دور از دسترس و نامعتبر Outlier and Invalid Data Detection

  • معرفی Intro

  • درک موارد پرت آماری Understanding Statistical Outliers

  • روش هایی برای تشخیص پرتگاه Methods for Outlier Detection

  • قانون 6 سیگما The 6 Sigma Rule

  • روش Boxplot The Boxplot Method

  • آزمون های فرضیه برای Outlier ها Hypothesis Tests for Outliers

  • دور از دسترس در ابعاد بالا Outliers in High Dimensionality

  • قابل قبول بودن بررسی و جایگزینی Plausibility Checks and Replacement

  • خلاصه Summary

منابع و خلاصه بیشتر Further Resources and Summary

  • معرفی Intro

  • تکرارپذیری در فرآیندهای تصادفی شبه Reproducibility in Pseudo Random Processes

  • پیش نمایش پردازش داده ها کارها Data Pre-processing Task Views

  • خلاصه دوره Course Summary

نمایش نظرات

آموزش کنار آمدن با داده های مفقود شده ، نامعتبر و تکراری در R
جزییات دوره
2h 1m
31
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
-
از 5
دارد
دارد
دارد
Martin Burger
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Martin Burger Martin Burger

مارتین پیش از آنکه مشاور علوم داده و نویسنده شود ، آمار زیست شناسی را مطالعه کرد و در چندین شرکت دارویی کار می کرد. وی بیش از 15 دوره در زمینه R ، Tableau 9 و سایر موضوعات مرتبط با علوم داده منتشر کرد. تمرکز اصلی وی بر روی نرم افزارهای تجزیه و تحلیل مانند R و SPSS است اما به ابزارهای مدرن تجسم داده مانند Tableau نیز علاقه مند است. اگر او مشغول برنامه نویسی ، وبلاگ نویسی یا کار با مفاهیم جدید تدریس نیست ، ممکن است او را در حال اسکی یا پیاده روی در کوه های آلپ پیدا کنید.