نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
کاوش داده یکی از اولین کارهایی است که هنگام تحلیل داده انجام می دهید. این راه را برای تجزیه و تحلیل عمق بیشتر هدایت می کند. با استفاده از این دوره ، شما یاد خواهید گرفت که چگونه از R برای کاوش داده ها در یک مجموعه داده بزرگ استفاده کنید. آیا می خواهید کاوش داده ها را در یک مجموعه داده بزرگ انجام دهید؟ در این دوره ، کاوش داده ها با تکنیک های کمی با استفاده از R ، خواهید فهمید که چرا R ابزاری عالی در شناخت اطلاعات شماست. این دوره از یک روش 3 مرحله ای برای کشف مجموعه داده پروازهای NYC استفاده می کند. ابتدا از طریق خلاصه آمار ایده اولیه خواهید گرفت. سپس ، برای کار روی متغیرهای منفرد ، از آزمون های فرضیه و تجسم استفاده خواهید کرد. سرانجام ، شما از تکنیک هایی برای همبستگی بین متغیرهای مختلف استفاده خواهید کرد. علاوه بر این ، این دوره همچنین دارای یک ماژول در مورد نمونه برداری از داده است که به ویژه برای مجموعه های داده بزرگ مفید است. پس از پایان این دوره ، مهارت و دانش کاوش داده های لازم برای درک یک مجموعه داده جدید را خواهید داشت. همچنین از برخی بسته های الحاقی برجسته برای موضوع استفاده خواهید کرد.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
درک اکتشاف داده
Understanding Data Exploration
-
مقدمه
Introduction
-
مدیریت انتظارات
Managing Expectations
-
مجموعه داده های دوره
Course Dataset
-
خلاصه داده ها
Data Summary
-
س Researchالات تحقیق
Research Questions
-
خلاصه
Summary
نمونه گیری از یک مجموعه داده برای کاوش داده ها
Sampling a Dataset for Data Exploration
-
مقدمه
Introduction
-
استفاده از ژنراتورهای تصادفی برای نمونه گیری
Using Random Generators for Sampling
-
تولید مثل فرآیندهای شبه تصادفی
Reproducing Pseudo-random Processes
-
از جدول با Rase نمونه برداری کنید
Sampling a Table with R Base
-
نمونه برداری از یک جدول با Dplyr
Sampling a Table with Dplyr
-
خلاصه
Summary
جمع بندی داده ها برای درک اطلاعات جدید
Summarizing Data to Get an Understanding of New Data
-
مقدمه
Introduction
-
خلاصه های مبتنی بر تعداد
Count Based Summaries
-
تعداد چند متغیره گروهی
Grouped Multivariate Counts
-
توزیع متغیرهای عددی
Distributions of Numeric Variables
-
سری طرح های ترکیبی
Combined Plot Series
-
خلاصه های مبتنی بر سری Times
Times Series Based Summaries
-
تجسم داده های جمع شده
Visualizing Aggregated Data
-
خلاصه
Summary
با استفاده از تحلیل همبستگی
Using Correlation Analysis
-
مقدمه
Introduction
-
همبستگی در متغیرهای عددی
Correlations in Numeric Variables
-
نسبت شانس
Odds Ratio
-
رگرسیون لجستیک برای متغیر نتیجه دودویی
Logistic Regression for Binary Outcome Variable
-
تجسم ترافیک بین فرودگاه ها
Visualizing the Traffic between the Airports
-
خلاصه دوره
Course Summary
نمایش نظرات