آموزش پیش پردازش داده برای تجزیه و تحلیل داده ها و علم داده

Data Pre-Processing for Data Analytics and Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: پیش پردازش برای تجزیه و تحلیل داده‌ها و دانش‌آموزان علوم داده دانش عمیقی در مورد تجزیه و تحلیل داده‌های اکتشافی و پیش پردازش داده‌ها کسب خواهند کرد. ما در مورد نحوه رسیدگی به داده های تکراری و گمشده یاد خواهیم گرفت. در نهایت، ما انواع درمان تجزیه و تحلیل Outlier را یاد خواهیم گرفت. با تکنیک‌های مقیاس‌بندی و تبدیل ویژگی‌ها آشنا می‌شویم. پیش نیازها: شناخت نقش برنامه‌نویسی پایتون در EDA. روش های باقی مانده در بخش آماده سازی داده های CRISP-ML(Q) را درک کنید. توصیه می شود که فراگیران از روش CRISP-ML(Q) آگاهی قبلی داشته باشند.

دوره پیش پردازش داده ها برای تجزیه و تحلیل داده ها و علم داده، درک جامعی از مراحل حیاتی آماده سازی داده های خام برای تجزیه و تحلیل به دانش آموزان ارائه می دهد. پیش پردازش داده یک مرحله اساسی در گردش کار علم داده است، زیرا شامل تبدیل، تمیز کردن و یکپارچه سازی داده ها برای اطمینان از کیفیت و قابلیت استفاده برای تجزیه و تحلیل بعدی است.

در طول این دوره، دانش‌آموزان تکنیک‌ها و استراتژی‌های مختلفی را برای مدیریت داده‌های دنیای واقعی، که اغلب آشفته، ناسازگار و ناقص هستند، یاد می‌گیرند. آنها تجربه عملی را با ابزارها و کتابخانه های محبوبی که برای پیش پردازش داده ها استفاده می شوند، مانند پایتون و کتابخانه های دستکاری داده های آن (مانند پانداها) به دست خواهند آورد و نمونه های عملی را برای تقویت یادگیری خود کاوش خواهند کرد.


موضوعات کلیدی تحت پوشش این دوره عبارتند از:

مقدمه ای بر پیش پردازش داده ها:

- درک اهمیت پیش پردازش داده ها در تجزیه و تحلیل داده ها و علم داده

- نمای کلی خط لوله پیش پردازش داده

- تکنیک های پاکسازی داده ها:


شناسایی و مدیریت مقادیر از دست رفته:

- برخورد با داده های پرت و پر سر و صدا

- رفع ناسازگاری ها و خطاها در داده ها

- تبدیل داده:


مقیاس‌سازی و عادی‌سازی ویژگی:

- مدیریت متغیرهای طبقه بندی شده از طریق تکنیک های رمزگذاری

- روش‌های کاهش ابعاد (به عنوان مثال، تجزیه و تحلیل مؤلفه اصلی)

- یکپارچه سازی و تجمیع داده ها:


ادغام و پیوستن به مجموعه داده‌ها:

- مدیریت داده ها از چندین منبع

- جمع آوری داده ها برای تجزیه و تحلیل و تجسم

- مدیریت متن و داده‌های سری زمانی:


تکنیک‌های پیش‌پردازش متن (به‌عنوان مثال، توکن‌سازی، ریشه‌یابی، حذف کلید واژه):

- پاکسازی داده های سری زمانی و استخراج ویژگی

- ارزیابی کیفیت داده:


پروفایل داده ها و تجزیه و تحلیل داده های اکتشافی

- معیارهای کیفیت داده و تکنیک‌های ارزیابی

- بهترین روش ها و ابزارها:


راهبردهای موثر پاکسازی و پیش پردازش داده ها:

- مقدمه ای بر کتابخانه ها و ابزارهای پیش پردازش داده های محبوب (مانند پانداها، NumPy)


سرفصل ها و درس ها

معرفی Introduction

  • مقدمه ای در مورد معلم خصوصی Introduction about Tutor

  • دستور کار و مراحل تجزیه و تحلیل Agenda and Stages of Analytics

  • تجزیه و تحلیل تشخیصی چیست؟ What is Diagnoistic Analytics ?

  • پیش بینی تجزیه و تحلیل چیست؟ What is Predictive Analytics ?

  • تجزیه و تحلیل تجویزی چیست؟ What is Prescriptive Analytics ?

  • CRISP-ML(Q) چیست؟ What is CRISP-ML(Q)?

  • امتحان Quiz

فاز تفاهم تجاری Business Understanding Phase

  • درک تجاری - محدوده کاربرد را تعریف کنید Business Understanding - Define Scope Of Application

  • درک کسب و کار - معیارهای موفقیت را تعریف کنید Business Understanding - Define Sucess Criteria

  • درک تجاری - موارد استفاده Business Understanding - Use Cases

  • امتحان Quiz

فاز درک داده - انواع داده Data Understanding Phase - Data Types

  • درک داده های دستور کار Agenda Data Understanding

  • مقدمه ای بر درک داده ها؟ Introduction to Data Understanding ?

  • انواع داده - پیوسته در مقابل گسسته Data Types - Continuous vs Discrete

  • داده های دسته بندی در مقابل داده های شمارش Categorical Data vs Count Data

  • درک عملی داده ها با استفاده از مثال های بلادرنگ Pratical Data Understanding Using Realtime Examples

  • مقیاس اندازه گیری Scale of Measurement

  • کمی در مقابل کیفی Quantitative Vs Qualitative

  • داده های ساختاریافته در مقابل داده های بدون ساختار Structured vs Unstructured Data

  • امتحان Quiz

فاز درک داده ها - جمع آوری داده ها Data Understanding Phase - Data Collection

  • جمع آوری داده چیست؟ What is Data Collection?

  • آشنایی با منابع داده اولیه Understanding Primary Data Sources

  • آشنایی با منابع داده ثانویه Understanding Secondary Data Sources

  • درک جمع آوری داده ها با استفاده از پیمایش Understanding Data Collection using Survey

  • درک جمع آوری داده ها با استفاده از DoE Understanding Data Collection using DoE

  • درک خطاهای احتمالی در مرحله جمع آوری داده ها Understanding Possible errors in Data Collection stage

  • درک تعصب و انصاف Understanding Bias and Fairness

  • امتحان Quiz

درک آمار پایه Understanding Basic Statistics

  • مقدمه ای بر تهیه و دستور کار داده های CRISP-ML(Q). Introduction to CRISP-ML(Q) Data Preparation & Agenda

  • احتمال چیست؟ What is Probability ?

  • متغیر تصادفی چیست؟ What is Random Variable?

  • درک احتمال و کاربرد آن، توزیع احتمال. Understanding Probability and its Application,Probability Distribution .

  • امتحان Quiz

مرحله آماده سازی داده - تجزیه و تحلیل داده های اکتشافی (EDA) Data Preparation Phase - Exploratory Data Analysis (EDA)

  • درک توزیع نرمال Understanding Normal Distribution

  • آمار استنباطی چیست؟ What is Inferencial Statistics?

  • درک توزیع عادی استاندارد و امتیازات Z چیست Understanding Standard Normal Distribution & Whats is Z Scores

  • درک معیارهای گرایش مرکزی (فرستادگی کسب و کار لحظه اول) Understanding Measures of central tendency ( First moment business decession)

  • درک معیارهای پراکندگی (تصمیم کسب و کار لحظه دوم) Understanding Measures of Dispersion ( Second moment business decision)

  • درک نمودار جعبه (اختلاف B-w درصد و Quantile و Quartile) Understanding Box Plot(Diff B-w Percentile and Quantile and Quartile)

  • درک تکنیک های گرافیکی-Q-Q-Plot Understanding Graphical Techniques-Q-Q-Plot

  • درک در مورد طرح پراکندگی دو متغیره Understanding about Bivariate Scatter Plot

  • امتحان Quiz

نصب و راه اندازی پایتون Python Installation and Setup

  • نصب پایتون Python Installation

  • نصب آناکوندا Anakonda Installation

  • آشنایی با کتابخانه های Anakonda Navigator، Spyder و Python Understand about Anakonda Navigator, Spyder & Python Libraries

  • آشنایی با Jupyter و Google Colab Understanding about Jupyter and Google Colab

  • امتحان Quiz

مرحله آماده سازی داده ها | Data Cleansing- Type Casting Data Preparation Phase | Data Cleansing- Type Casting

  • خلاصه مفاهیم Recap of Concepts

  • درک Data Cleansing Typecasting Understanding Data Cleansing Typecasting

  • درک Data Cleaning Typecasting با استفاده از Python Understanding Data Cleansing Typecasting Using Python

  • امتحان Quiz

مرحله آماده سازی داده ها | پاکسازی داده ها - رسیدگی به موارد تکراری Data Preparation Phase | Data Cleansing- Handling Duplicates

  • خلاصه مفاهیم Recap of Concepts

  • درک نحوه رسیدگی به موارد تکراری Understanding Handling Duplicates

  • آشنایی با مدیریت موارد تکراری با استفاده از پایتون Understanding Handling Duplicates using Python

  • امتحان Quiz

مرحله آماده سازی داده ها | درمان تجزیه و تحلیل پاکسازی داده ها Data Preparation Phase | Data Cleansing-Outlier Analysis Treatment

  • درک درمان تجزیه و تحلیل پرت Understanding Outlier Analysis Treatment

  • درک درمان تجزیه و تحلیل Outlier با استفاده از Python Understanding Outlier Analysis Treatment using Python

  • امتحان Quiz

نمایش نظرات

نظری ارسال نشده است.

آموزش پیش پردازش داده برای تجزیه و تحلیل داده ها و علم داده
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
9 hours
48
Udemy (یودمی) udemy-small
23 تیر 1402 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
1,275
4.7 از 5
ندارد
دارد
دارد

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Elearning Moocs Elearning Moocs

360DigiTMG یک موسسه آموزشی پیشرو است

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.