آموزش آماده‌سازی داده‌ها برای یادگیری ماشین در پایتون - آخرین آپدیت

دانلود Data Prep for Machine Learning in Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مدل‌های یادگیری ماشین برای تولید بینش‌های معنادار، به داده‌های باکیفیت وابسته هستند. به همین دلیل، آماده‌سازی داده‌ها (Data Prep) یکی از حیاتی‌ترین مهارت‌ها در حوزه یادگیری ماشین محسوب می‌شود. در این دوره، شما یاد خواهید گرفت که چگونه قبل از پر کردن مقادیر مفقود با استفاده از روش‌های جایگذاری (Imputation)، داده‌ها را وارد و پاکسازی کنید. همچنین با استفاده از نمودارهای هیستوگرام، نمودارهای پراکندگی (Scatter Charts) و نمودارهای جعبه‌ای (Box Plots)، یاد می‌گیرید که چگونه روندها را شناسایی کرده و از این تحلیل‌ها برای انتخاب مهم‌ترین ویژگی‌ها (Features) استفاده کنید. تکنیک‌های مهندسی ویژگی (Feature Engineering) مانند One Hot Encoding، دسته‌بندی (Binning) و مقیاس‌گذاری (Scaling) به ما کمک می‌کنند تا ساختار داده‌ها را برای استخراج بینش‌های باکیفیت‌تر در یادگیری ماشین تغییر دهیم. این دوره آماده‌سازی داده‌ها در پایتون، نسبت به دوره‌های قبلی BIDA، شامل تمرینات تعاملی و چالش‌های بیشتری است. همچنین شما این فرصت را خواهید داشت که قبل از آزمون نهایی، مهارت‌های خود را در یک مطالعه موردی جامع و هدایت‌شده در پایتون آزمایش کنید. پس از اتمام این دوره، شما قادر خواهید بود: • وارد کردن و پاکسازی داده‌ها در پایتون • اعمال روش‌های جایگذاری برای تخمین مقادیر مفقود در مجموعه داده • انجام تحلیل اکتشافی داده‌ها (EDA) برای یافتن الگوهای اولیه جهت هدایت تحلیل‌ها • انتخاب ویژگی‌ها برای تمرکز بر مهم‌ترین متغیرها • اعمال مهندسی ویژگی برای آماده‌سازی مجموعه‌ داده‌ها جهت استفاده در یادگیری ماشین • انتخاب تکنیک‌های مناسب مهندسی ویژگی بر اساس نوع مدل چه یک مدیر کسب‌وکار باشید و چه یک تحلیلگر مشتاق در حوزه علم داده، این دوره «آماده‌سازی داده‌ها برای یادگیری ماشین در پایتون» به عنوان یک مقدمه جامع برای شما عمل خواهد کرد. شما تمام اصطلاحات کلیدی را یاد می‌گیرید تا بتوانید با تیم‌های خود در مورد علم داده گفتگو کنید، تحلیل‌ها را پیاده‌سازی کنید و درک کنید که علم داده چگونه می‌تواند به کسب‌وکار شما کمک کند.

سرفصل ها و درس ها

مقدمه‌ای بر آماده‌سازی داده‌ها Introduction to Data Prep

  • معرفی دوره Course Introduction

  • دانش پیش‌نیاز Pre-requisite Knowledge

  • راهنمای سریع ساختار دوره، نوت‌بوک‌ها و تمرین‌ها A Quick Guide to Course Structure, Notebooks, and Exercises

وارد کردن و پاکسازی داده‌ها Importing & Cleaning Data

  • مقدمه: وارد کردن و پاکسازی داده‌ها Introduction - Importing & Cleaning Data

  • وارد کردن داده‌ها از فایل‌های CSV، اکسل و SQL Importing Data - CSV, Excel and SQL

  • انتخاب ستون‌ها Selecting Columns

  • فیلتر کردن ردیف‌ها Filtering Rows

  • تمرین: وارد کردن و فیلتر کردن داده‌ها Exercise - Import & Filter Data

  • مرور تمرین: وارد کردن و فیلتر کردن داده‌ها Exercise Review - Import & Filter Data

  • تئوری انواع داده‌ها Data Types Theory

  • اعتبارسنجی پایه داده‌ها Basic Data Validation

  • مقایسه با یک منبع داده معتبر Comparing to a Trusted Datasource

  • تمرین: اعتبارسنجی داده‌ها Exercise - Data Validation

  • مرور تمرین: اعتبارسنجی داده‌ها Exercise Review - Data Validation

  • تئوری جایگذاری (Imputation) Imputation Theory

  • پاکسازی داده‌ها Cleaning Data

  • خطاهای نوع داده Data Type Errors

  • جایگذاری با استفاده از صفر Imputation with Zeros

  • جایگذاری پایه مقادیر Basic Imputation of Values

  • تمرین: پاکسازی و جایگذاری Exercise - Cleaning & Imputation

  • مرور تمرین: پاکسازی و جایگذاری Exercise Review - Cleaning & Imputation

تحلیل اکتشافی داده‌ها (EDA) Exploratory Data Analysis

  • مقدمه: تحلیل اکتشافی داده‌ها (EDA) Introduction - Exploratory Data Analysis

  • آمار توصیفی برای ویژگی‌های عددی Descriptive Stats for Numeric Features

  • نمودارهای پایه برای ویژگی‌های عددی + ترکیب محورها و توابع Basic Plots for Numeric Features + Combining Axis & Functions

  • نمودارهای پایه برای ویژگی‌های طبقه‌بندی‌شده (Categorical) Basic Plots for Categorical Features

  • تمرین: بصری‌سازی ویژگی‌های عددی و طبقه‌بندی‌شده Exercise - Visuals for Numeric & Categoric Features

  • مرور تمرین: بصری‌سازی ویژگی‌های عددی و طبقه‌بندی‌شده Exercise Review - Visuals for Numeric & Categoric Features

  • تحلیل متغیر پیوسته در مقابل پیوسته (بخش ۱) Continuous vs Continuous Variable Analysis 1

  • تحلیل متغیر پیوسته در مقابل پیوسته (بخش ۲) Continuous vs Continuous Variable Analysis Part 2

  • تحلیل متغیر طبقه‌بندی‌شده در مقابل پیوسته Categorical vs Continuous Variable Analysis

  • تمرین: ایجاد و تحلیل نمودارهای چندمتغیره Exercise - Creating and Analyzing Multivariate Plots

  • مرور تمرین: ایجاد و تحلیل نمودارهای چندمتغیره Exercise Review - Creating and Analyzing Multivariate Plots

تقسیم داده‌های آموزش و تست (مرور) Train-Test Split (Recap)

  • آموزش در مقابل تست Training Vs Testing

  • تقسیم داده‌های آموزش و تست در SKLearn Train-Test Split in SKLearn

چالش هفته اول Week 1 Challenge

مهندسی ویژگی بخش ۱: کدگذاری و تبدیل Feature Engineering Part 1 - Encoding & Transformation

  • مقدمه: مهندسی ویژگی Introduction - Feature Engineering

  • تئوری آموزش در مقابل تست Training Vs Testing Theory

  • تئوری کدگذاری (شامل One Hot Encoding) Encoding Theory (inc One Hot Encoding)

  • شناسایی ستون‌ها و مقادیر طبقه‌بندی‌شده Identifying Categorical Columns & Values

  • اجرای One Hot Encoding در Pandas One Hot Encoding in Pandas

  • اجرای One Hot Encoding در SKLearn One Hot Encoding in SKLearn

  • تمرین: One Hot Encoding Exercise - One Hot Encoding

  • مرور تمرین: One Hot Encoding Exercise Review - One Hot Encoding

  • مرور تمرین One Hot Encoding (بخش ۲) Exercise Review On Hot Encoding Pt 2

  • مقایسه GetDummies با OneHotEncoder GetDummies vs OneHotEncoder

  • تئوری تبدیل توزیع‌ها Transforming Distributions Theory

  • شناسایی چولگی (Skew) در پایتون Identifying Skew in Python

  • تبدیل ویژگی‌ها در پایتون Transforming Features in Python

  • سناریوهای استفاده از Log Taking Logs Scenarios

  • تمرین: تبدیل‌ها Exercise - Transformations

  • مرور تمرین: تبدیل‌ها Exercise Review - Transformations

مهندسی ویژگی بخش ۲: داده‌های پرت، دسته‌بندی و مقیاس‌گذاری Feature Engineering Part 2 - Outliers, Binning, and Scaling

  • تئوری داده‌های پرت (Outliers) Outliers Theory

  • حذف داده‌های پرت Removing Outliers

  • اصلاح داده‌های پرت Modifying Outliers

  • تمرین: داده‌های پرت Exercise - Outliers

  • مرور تمرین: داده‌های پرت Exercise Review - Outliers

  • تئوری دسته‌بندی (Binning) Binning Theory

  • دسته‌بندی طبقه‌بندی‌شده Categorical Binning

  • دسته‌بندی بر اساس عرض و فرکانس Binning by Width & Frequency

  • دسته‌بندی دستی Manual Binning

  • نکات پایانی در مورد دسته‌بندی Final Thoughts on Binning

  • هموارسازی (Smoothing) Smoothing

  • هموارسازی در عمل Smoothing in Practice

  • تمرین: دسته‌بندی Exercise - Binning

  • مرور تمرین: دسته‌بندی Exercise Review - Binning

  • نکات پیشرفته در مورد دسته‌بندی Advanced Thoughts on Binning

  • چرا مقیاس‌گذاری ویژگی‌ها اهمیت دارد؟ Why Feature Scaling Matters

  • تئوری مقیاس‌گذاری ویژگی‌ها Scaling Features Theory

  • مقیاس‌گذاری Min-Max Min Max Scaling

  • مقیاس‌گذاری داده‌های تست Scaling Testing Data

  • نکات پایانی در مورد مقیاس‌گذاری Final Thoughts on Scaling

  • مقیاس‌گذاری استاندارد (Standard Scaler) Standard Scaler

  • تمرین: مقیاس‌گذاری Exercise - Scaling

  • مرور تمرین: مقیاس‌گذاری Exercise Review - Scaling

  • تصمیم‌گیری در مهندسی ویژگی Making Feature Engineering Decisions

انتخاب ویژگی Feature Selection

  • مقدمه: انتخاب ویژگی Introduction - Feature Selection

  • انتخاب دستی ویژگی Manual Feature Selection

  • انتخاب ویژگی با هدف پیوسته Feature Selection with Continuous Target

  • ضرایب همبستگی: متغیر پیوسته + ویژگی پیوسته Correlation Coefficients - Continuous Var + Continuous Feature

  • روش ANOVA: هدف پیوسته + ویژگی طبقه‌بندی‌شده ANOVA - Continuous Target + Categorical Feature

  • انتخاب ویژگی با متغیر هدف طبقه‌بندی‌شده Feature Selection with Categorical Target Variable

  • نمودار جعبه‌ای: متغیر طبقه‌بندی‌شده + ویژگی پیوسته Box Plots - Categorical Var + Continous Feature

  • آزمون کای‌اسکوئر: متغیر طبقه‌بندی‌شده + ویژگی طبقه‌بندی‌شده Chi-square - Categorical Var + Categorical Feature

  • خلاصه‌ای از تکنیک‌های انتخاب ویژگی Summary of Feature Selection Techniques

جمع‌بندی دوره Course Conclusion

  • نتیجه‌گیری Conclusion

چالش هفته دوم Week 2 Challenge

نمایش نظرات

آموزش آماده‌سازی داده‌ها برای یادگیری ماشین در پایتون
جزییات دوره
5h 47m
84
(آخرین آپدیت)
916
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده