آموزش علم داده در پایتون: مدل‌سازی طبقه‌بندی

Data Science in Python: Classification Modeling

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: یادگیری پایتون برای یادگیری ماشینی تحت نظارت علم داده و ساخت مدل‌های طبقه‌بندی با پروژه‌های سرگرم‌کننده و عملی بر پایه‌های یادگیری ماشین نظارت شده و مدل‌سازی طبقه‌بندی در پایتون تسلط پیدا کنید. مجموعه‌های آموزش، آزمایش و اعتبارسنجی ساخت و تفسیر k-نزدیک‌ترین همسایه‌ها و مدل‌های رگرسیون لجستیک با استفاده از scikit-learn ارزیابی عملکرد مدل با استفاده از ابزارهایی مانند ماتریس‌های سردرگمی و معیارهایی مانند دقت، دقت، یادآوری و تکنیک‌های یادگیری F1 برای مدل‌سازی داده‌های نامتعادل، از جمله تنظیم آستانه. روش‌های نمونه‌گیری و تنظیم وزن کلاس‌ها ساخت، تنظیم و ارزیابی مدل‌های درخت تصمیم برای طبقه‌بندی، از جمله مدل‌های مجموعه پیشرفته مانند جنگل‌های تصادفی و ماشین‌های تقویت‌شده گرادیان پیش نیازها: ما قویاً توصیه می‌کنیم که دوره‌های Data Prep & EDA و Regression خود را قبل از این Jupyter بخوانید. نوت بوک (دانلود رایگان، نصب را طی خواهیم کرد) آشنایی با پایتون و پانداهای پایه توصیه می شود، اما الزامی نیست.

این یک دوره آموزشی عملی و مبتنی بر پروژه است که برای کمک به شما در تسلط بر مبانی مدل‌سازی طبقه‌بندی در پایتون طراحی شده است.


ما با مرور گردش کار علم داده، بحث در مورد اهداف اولیه انواع الگوریتم‌های طبقه‌بندی، و بررسی عمیق مراحل مدل‌سازی طبقه‌بندی که در طول دوره از آنها استفاده خواهیم کرد، شروع می‌کنیم.


می‌آموزید که تجزیه و تحلیل داده‌های اکتشافی را انجام دهید، از تکنیک‌های مهندسی ویژگی‌ها مانند مقیاس‌بندی، متغیرهای ساختگی و binning استفاده کنید، و داده‌ها را با تقسیم آن به مجموعه داده‌های قطار، آزمایش و اعتبارسنجی برای مدل‌سازی آماده کنید.


از آنجا، مدل‌های رگرسیون لجستیکی K-Nearest Neighbors را متناسب می‌کنیم و شهودی برای تفسیر ضرایب آنها و ارزیابی عملکرد آنها با استفاده از ابزارهایی مانند ماتریس‌های سردرگمی و معیارهایی مانند دقت، دقت، و یادآوری ایجاد می‌کنیم. همچنین تکنیک‌هایی را برای مدل‌سازی داده‌های نامتعادل، از جمله تنظیم آستانه، روش‌های نمونه‌برداری مانند نمونه‌برداری بیش از حد SMOTE، و تنظیم وزن کلاس در تابع هزینه مدل پوشش خواهیم داد.


در طول دوره، شما نقش دانشمند داده را برای بخش مدیریت ریسک در بانک ملی Maven بازی خواهید کرد. با استفاده از مهارت‌هایی که در طول دوره یاد می‌گیرید، از Python برای کاوش داده‌های آن‌ها و ساخت مدل‌های طبقه‌بندی استفاده می‌کنید تا به‌طور دقیق مشخص کنید که کدام مشتریان بر اساس پروفایل‌هایشان دارای ریسک اعتباری بالا، متوسط ​​و پایین هستند.


در آخر، شما یاد خواهید گرفت که مدل های درخت تصمیم را برای طبقه بندی بسازید و ارزیابی کنید. این مدل‌ها را با استفاده از پایتون تطبیق، تجسم و تنظیم دقیق می‌کنید، سپس دانش خود را در مدل‌های مجموعه پیشرفته‌تر مانند جنگل‌های تصادفی و ماشین‌های تقویت‌شده گرادیان اعمال می‌کنید.


خلاصه دوره:


  • مقدمه ای بر علم داده

    • زمینه های علم داده و یادگیری ماشین را معرفی کنید، مهارت های ضروری را مرور کنید، و هر مرحله از گردش کار علم داده را معرفی کنید


  • طبقه بندی 101

    • اصول طبقه‌بندی را مرور کنید، از جمله اصطلاحات کلیدی، انواع و اهداف مدل‌سازی طبقه‌بندی، و گردش کار مدل‌سازی


  • Pre-Modeling Data Prep EDA

    • مروری بر مراحل آماده سازی داده های EDA لازم برای انجام مدل سازی، از جمله تکنیک های کلیدی برای کشف هدف، ویژگی ها و روابط آنها


  • K-نزدیکترین همسایه ها

    • بیاموزید که چگونه الگوریتم k-نزدیکترین همسایه (KNN) نقاط داده را طبقه بندی می کند و ساختن مدل های KNN را در پایتون تمرین کنید


  • رگرسیون لجستیک

    • رگرسیون لجستیک را معرفی کنید، ریاضیات پشت مدل را بیاموزید و برازش آنها و تنظیم قدرت منظم سازی را تمرین کنید


  • معیارهای طبقه بندی

    • یاد بگیرید چگونه و چه زمانی از چندین معیار مهم برای ارزیابی مدل‌های طبقه‌بندی استفاده کنید، مانند دقت، یادآوری، امتیاز F1 و ROC-AUC


  • داده های نامتعادل

    • چالش‌های مدل‌سازی داده‌های نامتعادل را درک کنید و استراتژی‌هایی را برای بهبود عملکرد مدل در این سناریوها بیاموزید


  • درختان تصمیم

    • مدل‌های درخت تصمیم را بسازید و ارزیابی کنید، الگوریتم‌هایی که به دنبال شکاف‌هایی در داده‌های شما هستند که کلاس‌های شما را به بهترین شکل از هم جدا می‌کنند


  • مدل های گروه

    • با اصول اولیه مدل‌های گروهی آشنا شوید، سپس به مدل‌های خاصی مانند جنگل‌های تصادفی و ماشین‌های تقویت‌شده گرادیان بپردازید


__________


آماده شیرجه رفتن هستید؟ امروز بپیوندید و به موارد زیر دسترسی فوری و مادام العمر داشته باشید:


  • 9.5 ساعت ویدیو با کیفیت بالا

  • 18 تکلیف

  • 9 آزمون

  • 2 پروژه

  • علم داده در پایتون: کتاب الکترونیکی طبقه بندی (250+ صفحه)

  • راه حل فایل های پروژه قابل دانلود

  • پشتیبانی تخصصی و انجمن پرسش و پاسخ

  • 30 روز ضمانت رضایت Udemy


اگر دانشمند داده مشتاقی هستید که به دنبال معرفی دنیای مدل‌سازی طبقه‌بندی با پایتون هستید، این دوره برای شما مناسب است.


یادگیری مبارک!

-Chris Bruehl (مدرس ارشد پایتون، متخصص علوم داده، Maven Analytics)


سرفصل ها و درس ها

معرفی Introduction

  • معرفی دوره Course Introduction

  • درباره این سریال About This Series

  • ساختار و طرح کلی دوره Course Structure & Outline

  • مرا بخوانید: نکات مهم برای دانشجویان جدیدالورود READ ME: Important Notes for New Students

  • دانلود: منابع دوره DOWNLOAD: Course Resources

  • معرفی پروژه دوره Introducing the Course Project

  • تعیین انتظارات Setting Expectations

  • نصب و راه اندازی Jupyter Jupyter Installation & Launch

مقدمه ای بر علم داده Intro to Data Science

  • علم داده چیست؟ What is Data Science?

  • مجموعه مهارت های علم داده The Data Science Skillset

  • یادگیری ماشینی چیست؟ What is Machine Learning?

  • الگوریتم های رایج یادگیری ماشین Common Machine Learning Algorithms

  • گردش کار علم داده Data Science Workflow

  • مراحل آماده سازی داده و EDA Data Prep & EDA Steps

  • مراحل مدلسازی Modeling Steps

  • مدل سازی طبقه بندی Classification Modeling

  • خوراکی های کلیدی Key Takeaways

  • مقدمه ای بر علم داده Intro to Data Science

طبقه بندی 101 Classification 101

  • طبقه بندی 101 Classification 101

  • اهداف طبقه بندی Goals of Classification

  • انواع طبقه بندی Types of Classification

  • گردش کار مدل سازی طبقه بندی Classification Modeling Workflow

  • خوراکی های کلیدی Key Takeaways

  • طبقه بندی 101 Classification 101

آماده سازی داده و EDA Data Prep & EDA

  • EDA برای طبقه بندی EDA For Classification

  • تعریف یک هدف Defining a Target

  • DEMO: تعریف یک هدف DEMO: Defining a Target

  • کاوش در هدف Exploring the Target

  • کاوش در ویژگی ها Exploring the Features

  • DEMO: کاوش در ویژگی ها DEMO: Exploring the Features

  • تکلیف: کاوش در هدف و ویژگی ها ASSIGNMENT: Exploring the Target & Features

  • راه حل: کاوش در هدف و ویژگی ها SOLUTION: Exploring the Target & Features

  • همبستگی Correlation

  • نکته حرفه ای: ماتریس همبستگی PRO TIP: Correlation Matrix

  • دمو: ماتریس همبستگی DEMO: Correlation Matrix

  • روابط ویژگی-هدف Feature-Target Relationships

  • روابط ویژگی-ویژگی Feature-Feature Relationships

  • نکته حرفه ای: پلات ها را جفت کنید PRO TIP: Pair Plots

  • تکلیف: کاوش در روابط ASSIGNMENT: Exploring Relationships

  • راه حل: کاوش در روابط SOLUTION: Exploring Relationships

  • بررسی اجمالی مهندسی ویژگی Feature Engineering Overview

  • مهندسی ویژگی های عددی Numeric Feature Engineering

  • متغیرهای ساختگی Dummy Variables

  • مقوله های بنینگ Binning Categories

  • DEMO: مهندسی ویژگی DEMO: Feature Engineering

  • تقسیم داده ها Data Splitting

  • آماده سازی داده ها برای مدل سازی Preparing Data for Modeling

  • تکلیف: آماده سازی داده ها برای مدل سازی ASSIGNMENT: Preparing the Data for Modeling

  • راه حل: داده ها را برای مدل سازی آماده کنید SOLUTION: Prepare the Data for Modeling

  • خوراکی های کلیدی Key Takeaways

  • آماده سازی داده و EDA Data Prep & EDA

K-نزدیک ترین همسایه ها K-Nearest Neighbors

  • K-نزدیک ترین همسایه ها K-Nearest Neighbors

  • گردش کار KNN The KNN Workflow

  • KNN در پایتون KNN in Python

  • دقت مدل Model Accuracy

  • ماتریس سردرگمی Confusion Matrix

  • نسخه ی نمایشی: ماتریس سردرگمی DEMO: Confusion Matrix

  • تکلیف: برازش یک مدل ساده KNN ASSIGNMENT: Fitting a Simple KNN Model

  • راه حل: برازش یک مدل ساده KNN SOLUTION: Fitting a Simple KNN Model

  • تنظیم فراپارامتر Hyperparameter Tuning

  • تطبیق بیش از حد و اعتبارسنجی Overfitting & Validation

  • DEMO: تنظیم فراپارامتر DEMO: Hyperparameter Tuning

  • طبقه بندی سخت در مقابل نرم Hard vs. Soft Classification

  • DEMO: احتمال در مقابل نرخ رویداد DEMO: Probability vs. Event Rate

  • تکلیف: تنظیم یک مدل KNN ASSIGNMENT: Tuning a KNN Model

  • راه حل: تنظیم یک مدل KNN SOLUTION: Tuning a KNN Model

  • مزایا و معایب KNN Pros & Cons of KNN

  • خوراکی های کلیدی Key Takeaways

  • K-نزدیک ترین همسایه ها K-Nearest Neighbors

رگرسیون لجستیک Logistic Regression

  • رگرسیون لجستیک Logistic Regression

  • لجستیک در مقابل رگرسیون خطی Logistic vs. Linear Regression

  • عملکرد لجستیک The Logistic Function

  • احتمال Likelihood

  • رگرسیون لجستیک چندگانه Multiple Logistic Regression

  • گردش کار رگرسیون لجستیک The Logistic Regression Workflow

  • رگرسیون لجستیک در پایتون Logistic Regression in Python

  • ضرایب تفسیر Interpreting Coefficients

  • تکلیف: رگرسیون لجستیک ASSIGNMENT: Logistic Regression

  • راه حل: رگرسیون لجستیک SOLUTION: Logistic Regression

  • مهندسی و انتخاب ویژگی Feature Engineering & Selection

  • منظم سازی Regularization

  • تنظیم یک مدل منظم Tuning a Regularized Model

  • DEMO: رگرسیون لجستیک منظم DEMO: Regularized Logistic Regression

  • تکلیف: رگرسیون لجستیک منظم ASSIGNMENT: Regularized Logistic Regression

  • راه حل: رگرسیون لجستیک منظم SOLUTION: Regularized Logistic Regression

  • رگرسیون لجستیک چند طبقه Multi-class Logistic Regression

  • تکلیف: رگرسیون لجستیک چند طبقه ASSIGNMENT: Multi-class Logistic Regression

  • راه حل: رگرسیون لجستیک چند کلاسه SOLUTION: Multi-class Logistic Regression

  • مزایا و معایب رگرسیون لجستیک Pros & Cons of Logistic Regression

  • خوراکی های کلیدی Key Takeaways

  • رگرسیون لجستیک Logistic Regression

معیارهای طبقه بندی Classification Metrics

  • معیارهای طبقه بندی Classification Metrics

  • دقت، دقت و یادآوری Accuracy, Precision & Recall

  • DEMO: دقت، دقت و یادآوری DEMO: Accuracy, Precision & Recall

  • نکته حرفه ای: امتیاز F1 PRO TIP: F1 Score

  • تکلیف: معیارهای مدل ASSIGNMENT: Model Metrics

  • راه حل: معیارهای مدل SOLUTION: Model Metrics

  • طبقه بندی نرم Soft Classification

  • DEMO: Leveraging Soft Classification DEMO: Leveraging Soft Classification

  • نکته حرفه ای: منحنی های فراخوان دقیق و F1 PRO TIP: Precision-Recall & F1 Curves

  • DEMO: رسم منحنی های دقیق-یادآوری و F1 DEMO: Plotting Precision-Recall & F1 Curves

  • منحنی ROC و AUC The ROC Curve & AUC

  • نسخه آزمایشی: منحنی ROC و AUC DEMO: The ROC Curve & AUC

  • خلاصه معیارهای طبقه بندی Classification Metrics Recap

  • تکلیف: تغییر آستانه ASSIGNMENT: Threshold Shifting

  • راه حل: تغییر آستانه SOLUTION: Threshold Shifting

  • متریک چند کلاسه Multi-class Metrics

  • معیارهای چند کلاسه در پایتون Multi-class Metrics in Python

  • تکلیف: معیارهای چند کلاسه ASSIGNMENT: Multi-class Metrics

  • راه حل: معیارهای چند کلاسه SOLUTION: Multi-class Metrics

  • خوراکی های کلیدی Key Takeaways

  • معیارهای طبقه بندی Classification Metrics

داده های نامتعادل Imbalanced Data

  • داده های نامتعادل Imbalanced Data

  • مدیریت داده های نامتعادل Managing Imbalanced Data

  • تغییر آستانه Threshold Shifting

  • استراتژی های نمونه گیری Sampling Strategies

  • نمونه برداری بیش از حد Oversampling

  • نمونه برداری بیش از حد در پایتون Oversampling in Python

  • DEMO: نمونه برداری بیش از حد DEMO: Oversampling

  • SMOTE SMOTE

  • SMOTE در پایتون SMOTE in Python

  • کم نمونه گیری Undersampling

  • کم نمونه برداری در پایتون Undersampling in Python

  • تکلیف: روش های نمونه گیری ASSIGNMENT: Sampling Methods

  • راه حل: روش های نمونه گیری SOLUTION: Sampling Methods

  • تغییر وزن کلاس Changing Class Weights

  • DEMO: تغییر وزن کلاس DEMO: Changing Class Weights

  • تکلیف: تغییر وزن کلاس ASSIGNMENT: Changing Class Weights

  • راه حل: تغییر وزن کلاس SOLUTION: Changing Class Weights

  • جمع بندی داده های نامتعادل Imbalanced Data Recap

  • خوراکی های کلیدی Key Takeaways

  • داده های نامتعادل Imbalanced Data

پروژه میان دوره Mid-Course Project

  • خلاصه پروژه Project Brief

  • راه حل Solution Walkthrough

درختان تصمیم Decision Trees

  • درختان تصمیم Decision Trees

  • آنتروپی Entropy

  • پیش بینی درخت تصمیم Decision Tree Predictions

  • درختان تصمیم در پایتون Decision Trees in Python

  • DEMO: درختان تصمیم DEMO: Decision Trees

  • اهمیت ویژگی Feature Importance

  • تکلیف: درختان تصمیم ASSIGNMENT: Decision Trees

  • راه حل: درختان تصمیم SOLUTION: Decision Trees

  • تنظیم فراپارامتر برای درختان تصمیم Hyperparameter Tuning for Decision Trees

  • DEMO: تنظیم فراپارامتر DEMO: Hyperparameter Tuning

  • تکلیف: درخت تصمیم تنظیم شده ASSIGNMENT: Tuned Decision Tree

  • راه حل: درخت تصمیم تنظیم شده SOLUTION: Tuned Decision Tree

  • مزایا و معایب درختان تصمیم Pros & Cons of Decision Trees

  • خوراکی های کلیدی Key Takeaways

  • درختان تصمیم Decision Trees

مدل های گروه Ensemble Models

  • مدل های گروه Ensemble Models

  • مدل های ساده مجموعه Simple Ensemble Models

  • نسخه ی نمایشی: مدل های گروه ساده DEMO: Simple Ensemble Models

  • تکلیف: مدل های گروه ساده ASSIGNMENT: Simple Ensemble Models

  • راه حل: مدل های گروه ساده SOLUTION: Simple Ensemble Models

  • جنگل های تصادفی Random Forests

  • برازش جنگل های تصادفی در پایتون Fitting Random Forests in Python

  • تنظیم فراپارامتر برای جنگل های تصادفی Hyperparameter Tuning for Random Forests

  • نکته حرفه ای: جستجوی تصادفی PRO TIP: Random Search

  • مزایا و معایب جنگل های تصادفی Pros & Cons of Random Forests

  • تکلیف: جنگل های تصادفی ASSIGNMENT: Random Forests

  • راه حل: جنگل های تصادفی SOLUTION: Random Forests

  • افزایش گرادیان Gradient Boosting

  • افزایش گرادیان در پایتون Gradient Boosting in Python

  • تنظیم فراپارامتر برای افزایش گرادیان Hyperparameter Tuning for Gradient Boosting

  • DEMO: تنظیم فراپارامتر برای افزایش گرادیان DEMO: Hyperparameter Tuning for Gradient Boosting

  • مزایا و معایب افزایش گرادیان Pros & Cons of Gradient Boosting

  • تکلیف: افزایش گرادیان ASSIGNMENT: Gradient Boosting

  • راه حل: افزایش گرادیان SOLUTION: Gradient Boosting

  • نکته حرفه ای: مقادیر SHAP PRO TIP: SHAP Values

  • DEMO: ارزش های SHAP DEMO: SHAP Values

  • خوراکی های کلیدی Key Takeaways

  • مدل های گروه Ensemble Models

خلاصه طبقه بندی Classification Summary

  • خلاصه: مدل‌های طبقه‌بندی و گردش کار Recap: Classification Models & Workflow

  • مزایا و معایب مدل های طبقه بندی Pros & Cons of Classification Models

  • DEMO: خط لوله تولید و استقرار DEMO: Production Pipeline & Deployment

  • نگاه به آینده: یادگیری بدون نظارت Looking Ahead: Unsupervised Learning

پروژه نهایی Final Project

  • خلاصه پروژه Project Brief

  • راه حل Solution Walkthrough

مراحل بعدی Next Steps

  • درس جایزه BONUS LESSON

نمایش نظرات

آموزش علم داده در پایتون: مدل‌سازی طبقه‌بندی
جزییات دوره
10 hours
170
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
469
4.9 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Maven Analytics Maven Analytics

برنده جایزه تجزیه و تحلیل و آموزش هوش تجاری

Chris Bruehl Chris Bruehl

مربی اصلی پایتون در Maven Analytics