نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
درباره مهمترین مراحل آماده سازی داده ها بیاموزید: محاسبه ارزش از دست رفته ، تشخیص مجزا و حذف تکراری. این دوره بخشی از موارد زیر است: پاک کردن داده ها با R Rath همه را بزرگ کنید بررسی اجمالی دوره 1m 56s مدیریت داده های تکراری 28 متر 43s مدیریت داده های از دست رفته 37 متر 54s تشخیص داده دور از دسترس و نامعتبر 37 متر 52s منابع و خلاصه بیشتر 14 متر 35s علائم تجاری و نام تجاری اشخاص ثالث ذکر شده در این دوره متعلق به صاحبان مربوطه می باشند و Pluralsight وابسته یا تأیید شده توسط این احزاب نیست.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
مدیریت داده های تکراری
Managing Duplicate Data
-
معرفی
Intro
-
مدیریت انتظارات
Managing Expectations
-
مجموعه داده های دوره
Course Dataset
-
وارد کردن داده
Data Import
-
عوامل در مقابل داده های کاراکتر
Factors vs. Character Data
-
جانشینی مراحل در پیش پردازش داده ها
Succession of Steps in Data Pre-processing
-
داده ها را در R Base و dplyr کپی کنید
Duplicate Data in R Base and dplyr
-
خلاصه
Summary
مدیریت داده های از دست رفته
Managing Missing Data
-
معرفی
Intro
-
درک ارزش های از دست رفته
Understanding Missing Values
-
روشهای سریع و ساده برای از دست دادن مقادیر
Quick and Simple Methods for Missing Values
-
روشهای ورودی
Imputation Methods
-
استفاده از visdat برای تجسم NA
Using visdat for NA Visualizations
-
MICE برای ارزشهای گمشده
MICE for Missing Values
-
یادگیری ماشینی برای ارزش های از دست رفته
Machine Learning for Missing Values
-
کار روی مجموعه داده کارپارت
Working on the Carparts Dataset
-
خلاصه
Summary
تشخیص داده دور از دسترس و نامعتبر
Outlier and Invalid Data Detection
-
معرفی
Intro
-
درک موارد پرت آماری
Understanding Statistical Outliers
-
روش هایی برای تشخیص پرتگاه
Methods for Outlier Detection
-
قانون 6 سیگما
The 6 Sigma Rule
-
روش Boxplot
The Boxplot Method
-
آزمون های فرضیه برای Outlier ها
Hypothesis Tests for Outliers
-
دور از دسترس در ابعاد بالا
Outliers in High Dimensionality
-
قابل قبول بودن بررسی و جایگزینی
Plausibility Checks and Replacement
-
خلاصه
Summary
منابع و خلاصه بیشتر
Further Resources and Summary
-
معرفی
Intro
-
تکرارپذیری در فرآیندهای تصادفی شبه
Reproducibility in Pseudo Random Processes
-
پیش نمایش پردازش داده ها کارها
Data Pre-processing Task Views
-
خلاصه دوره
Course Summary
نمایش نظرات