آموزش پیش پردازش داده برای تجزیه و تحلیل داده ها و علم داده

Data Pre-Processing for Data Analytics and Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: پیش پردازش برای تجزیه و تحلیل داده‌ها و دانش‌آموزان علوم داده دانش عمیقی در مورد تجزیه و تحلیل داده‌های اکتشافی و پیش پردازش داده‌ها کسب خواهند کرد. ما در مورد نحوه رسیدگی به داده های تکراری و گمشده یاد خواهیم گرفت. در نهایت، ما انواع درمان تجزیه و تحلیل Outlier را یاد خواهیم گرفت. با تکنیک‌های مقیاس‌بندی و تبدیل ویژگی‌ها آشنا می‌شویم. پیش نیازها: شناخت نقش برنامه‌نویسی پایتون در EDA. روش های باقی مانده در بخش آماده سازی داده های CRISP-ML(Q) را درک کنید. توصیه می شود که فراگیران از روش CRISP-ML(Q) آگاهی قبلی داشته باشند.

دوره پیش پردازش داده ها برای تجزیه و تحلیل داده ها و علم داده، درک جامعی از مراحل حیاتی آماده سازی داده های خام برای تجزیه و تحلیل به دانش آموزان ارائه می دهد. پیش پردازش داده یک مرحله اساسی در گردش کار علم داده است، زیرا شامل تبدیل، تمیز کردن و یکپارچه سازی داده ها برای اطمینان از کیفیت و قابلیت استفاده برای تجزیه و تحلیل بعدی است.

در طول این دوره، دانش‌آموزان تکنیک‌ها و استراتژی‌های مختلفی را برای مدیریت داده‌های دنیای واقعی، که اغلب آشفته، ناسازگار و ناقص هستند، یاد می‌گیرند. آنها تجربه عملی را با ابزارها و کتابخانه های محبوبی که برای پیش پردازش داده ها استفاده می شوند، مانند پایتون و کتابخانه های دستکاری داده های آن (مانند پانداها) به دست خواهند آورد و نمونه های عملی را برای تقویت یادگیری خود کاوش خواهند کرد.


موضوعات کلیدی تحت پوشش این دوره عبارتند از:

مقدمه ای بر پیش پردازش داده ها:

- درک اهمیت پیش پردازش داده ها در تجزیه و تحلیل داده ها و علم داده

- نمای کلی خط لوله پیش پردازش داده

- تکنیک های پاکسازی داده ها:


شناسایی و مدیریت مقادیر از دست رفته:

- برخورد با داده های پرت و پر سر و صدا

- رفع ناسازگاری ها و خطاها در داده ها

- تبدیل داده:


مقیاس‌سازی و عادی‌سازی ویژگی:

- مدیریت متغیرهای طبقه بندی شده از طریق تکنیک های رمزگذاری

- روش‌های کاهش ابعاد (به عنوان مثال، تجزیه و تحلیل مؤلفه اصلی)

- یکپارچه سازی و تجمیع داده ها:


ادغام و پیوستن به مجموعه داده‌ها:

- مدیریت داده ها از چندین منبع

- جمع آوری داده ها برای تجزیه و تحلیل و تجسم

- مدیریت متن و داده‌های سری زمانی:


تکنیک‌های پیش‌پردازش متن (به‌عنوان مثال، توکن‌سازی، ریشه‌یابی، حذف کلید واژه):

- پاکسازی داده های سری زمانی و استخراج ویژگی

- ارزیابی کیفیت داده:


پروفایل داده ها و تجزیه و تحلیل داده های اکتشافی

- معیارهای کیفیت داده و تکنیک‌های ارزیابی

- بهترین روش ها و ابزارها:


راهبردهای موثر پاکسازی و پیش پردازش داده ها:

- مقدمه ای بر کتابخانه ها و ابزارهای پیش پردازش داده های محبوب (مانند پانداها، NumPy)


سرفصل ها و درس ها

معرفی Introduction

  • مقدمه ای در مورد معلم خصوصی Introduction about Tutor

  • دستور کار و مراحل تجزیه و تحلیل Agenda and Stages of Analytics

  • تجزیه و تحلیل تشخیصی چیست؟ What is Diagnoistic Analytics ?

  • پیش بینی تجزیه و تحلیل چیست؟ What is Predictive Analytics ?

  • تجزیه و تحلیل تجویزی چیست؟ What is Prescriptive Analytics ?

  • CRISP-ML(Q) چیست؟ What is CRISP-ML(Q)?

  • امتحان Quiz

فاز تفاهم تجاری Business Understanding Phase

  • درک تجاری - محدوده کاربرد را تعریف کنید Business Understanding - Define Scope Of Application

  • درک کسب و کار - معیارهای موفقیت را تعریف کنید Business Understanding - Define Sucess Criteria

  • درک تجاری - موارد استفاده Business Understanding - Use Cases

  • امتحان Quiz

فاز درک داده - انواع داده Data Understanding Phase - Data Types

  • درک داده های دستور کار Agenda Data Understanding

  • مقدمه ای بر درک داده ها؟ Introduction to Data Understanding ?

  • انواع داده - پیوسته در مقابل گسسته Data Types - Continuous vs Discrete

  • داده های دسته بندی در مقابل داده های شمارش Categorical Data vs Count Data

  • درک عملی داده ها با استفاده از مثال های بلادرنگ Pratical Data Understanding Using Realtime Examples

  • مقیاس اندازه گیری Scale of Measurement

  • کمی در مقابل کیفی Quantitative Vs Qualitative

  • داده های ساختاریافته در مقابل داده های بدون ساختار Structured vs Unstructured Data

  • امتحان Quiz

فاز درک داده ها - جمع آوری داده ها Data Understanding Phase - Data Collection

  • جمع آوری داده چیست؟ What is Data Collection?

  • آشنایی با منابع داده اولیه Understanding Primary Data Sources

  • آشنایی با منابع داده ثانویه Understanding Secondary Data Sources

  • درک جمع آوری داده ها با استفاده از پیمایش Understanding Data Collection using Survey

  • درک جمع آوری داده ها با استفاده از DoE Understanding Data Collection using DoE

  • درک خطاهای احتمالی در مرحله جمع آوری داده ها Understanding Possible errors in Data Collection stage

  • درک تعصب و انصاف Understanding Bias and Fairness

  • امتحان Quiz

درک آمار پایه Understanding Basic Statistics

  • مقدمه ای بر تهیه و دستور کار داده های CRISP-ML(Q). Introduction to CRISP-ML(Q) Data Preparation & Agenda

  • احتمال چیست؟ What is Probability ?

  • متغیر تصادفی چیست؟ What is Random Variable?

  • درک احتمال و کاربرد آن، توزیع احتمال. Understanding Probability and its Application,Probability Distribution .

  • امتحان Quiz

مرحله آماده سازی داده - تجزیه و تحلیل داده های اکتشافی (EDA) Data Preparation Phase - Exploratory Data Analysis (EDA)

  • درک توزیع نرمال Understanding Normal Distribution

  • آمار استنباطی چیست؟ What is Inferencial Statistics?

  • درک توزیع عادی استاندارد و امتیازات Z چیست Understanding Standard Normal Distribution & Whats is Z Scores

  • درک معیارهای گرایش مرکزی (فرستادگی کسب و کار لحظه اول) Understanding Measures of central tendency ( First moment business decession)

  • درک معیارهای پراکندگی (تصمیم کسب و کار لحظه دوم) Understanding Measures of Dispersion ( Second moment business decision)

  • درک نمودار جعبه (اختلاف B-w درصد و Quantile و Quartile) Understanding Box Plot(Diff B-w Percentile and Quantile and Quartile)

  • درک تکنیک های گرافیکی-Q-Q-Plot Understanding Graphical Techniques-Q-Q-Plot

  • درک در مورد طرح پراکندگی دو متغیره Understanding about Bivariate Scatter Plot

  • امتحان Quiz

نصب و راه اندازی پایتون Python Installation and Setup

  • نصب پایتون Python Installation

  • نصب آناکوندا Anakonda Installation

  • آشنایی با کتابخانه های Anakonda Navigator، Spyder و Python Understand about Anakonda Navigator, Spyder & Python Libraries

  • آشنایی با Jupyter و Google Colab Understanding about Jupyter and Google Colab

  • امتحان Quiz

مرحله آماده سازی داده ها | Data Cleansing- Type Casting Data Preparation Phase | Data Cleansing- Type Casting

  • خلاصه مفاهیم Recap of Concepts

  • درک Data Cleansing Typecasting Understanding Data Cleansing Typecasting

  • درک Data Cleaning Typecasting با استفاده از Python Understanding Data Cleansing Typecasting Using Python

  • امتحان Quiz

مرحله آماده سازی داده ها | پاکسازی داده ها - رسیدگی به موارد تکراری Data Preparation Phase | Data Cleansing- Handling Duplicates

  • خلاصه مفاهیم Recap of Concepts

  • درک نحوه رسیدگی به موارد تکراری Understanding Handling Duplicates

  • آشنایی با مدیریت موارد تکراری با استفاده از پایتون Understanding Handling Duplicates using Python

  • امتحان Quiz

مرحله آماده سازی داده ها | درمان تجزیه و تحلیل پاکسازی داده ها Data Preparation Phase | Data Cleansing-Outlier Analysis Treatment

  • درک درمان تجزیه و تحلیل پرت Understanding Outlier Analysis Treatment

  • درک درمان تجزیه و تحلیل Outlier با استفاده از Python Understanding Outlier Analysis Treatment using Python

  • امتحان Quiz

نمایش نظرات

آموزش پیش پردازش داده برای تجزیه و تحلیل داده ها و علم داده
جزییات دوره
9 hours
48
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
1,275
4.7 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Elearning Moocs Elearning Moocs

360DigiTMG یک موسسه آموزشی پیشرو است