آموزش صفر تا علوم داده چابک - آخرین آپدیت

دانلود Zero to Agile Data Science

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

یاد بگیرید چگونه به طور تکراری مدل‌های علم داده را توسعه دهید

سرفصل‌های دوره:

  • یادگیری ماشین
  • علم داده چابک
  • علم داده
  • داده‌های نامتعادل
  • پیش‌بینی تقلب کارت اعتباری
  • پیش‌بینی ریزش مشتری
  • پیش‌بینی ورشکستگی مالی
  • مهندسی ویژگی
  • تنظیم ابرپارامترها
  • مدل‌های ترکیبی
  • طبقه‌بندی دودویی
  • XGBoost
  • تشخیص ناهنجاری

پیش‌نیازها:

  • دانشجویان باید دوره‌های مقدماتی علم داده را گذرانده باشند تا با اجرای نوت‌بوک‌های Jupyter در پایتون آشنا باشند.
  • آشنایی با بسته‌های scikit-learn.
  • دانشجو باید قادر به راه‌اندازی محیط Jupyter خود در لپ‌تاپ یا در فضای ابری باشد.

در این دوره، شما یاد خواهید گرفت که چگونه تکنیک‌های علم داده چابک را برای حل مسائل طبقه‌بندی از طریق 3 پروژه به کار ببرید: پیش‌بینی تقلب کارت اعتباری، پیش‌بینی ریزش مشتری و پیش‌بینی ورشکستگی مالی.

هر پروژه دارای 5 تکرار خواهد بود که با عنوان 'روز 1' تا 'روز 5' برچسب‌گذاری شده‌اند و شما را به آرامی از یک طبقه‌بند Random Forest ساده به یک ensemble تنظیم‌شده از 5 طبقه‌بند (XGBoost, LightGBM, Gradient Boosted Decision Trees, Extra Trees و Random Forest) که بر روی داده‌های upsampled ارزیابی شده‌اند، می‌رساند.

این دوره برای دانشمندان داده متوسطه‌ای که به دنبال گسترش مهارت‌های خود در موارد زیر هستند، ایده‌آل است:

  1. تشخیص خودکار ستون‌های بد در داده‌های خام (روز 1)
  2. ایجاد معیار (metric) خود برای مجموعه‌داده‌های نامتعادل (روز 1)
  3. چهار تکنیک Data Resampling (روز 2)
  4. مدیریت مقادیر Null (روز 2)
  5. دو تکنیک مهندسی ویژگی (روز 3)
  6. چهار تکنیک کاهش ویژگی (روز 3)
  7. کاهش ردپای حافظه (روز 3)
  8. تنظیم یک تابع امتیازدهی سفارشی در داخل GridSearchCV (روز 4)
  9. تغییر معیار امتیازدهی پیش‌فرض برای XGBoost (روز 5)
  10. ساخت meta-model (روز 5)

نوت‌بوک‌های Jupyter کامل با کد منبع و یک کتابخانه از توابع قابل استفاده مجدد در اختیار دانش‌آموزان قرار می‌گیرد تا در پروژه‌های خود در صورت نیاز استفاده کنند!


سرفصل ها و درس ها

Introduction-مقدمه Introduction

  • 1.0 Course Intro-مقدمه دوره 1.0 Course Intro

  • 1.1 Course Audience-مخاطبان دوره 1.1 Course Audience

  • 1.2 Course Overview-مرور کلی دوره 1.2 Course Overview

  • 1.3 Course Benefits-مزایای دوره 1.3 Course Benefits

  • 1.4 Course Setup-راه‌اندازی دوره 1.4 Course Setup

  • 1.5 Formatting Jupyter Notebook Table of Content-قالب‌بندی فهرست مطالب نوت‌بوک‌ های Jupyter 1.5 Formatting Jupyter Notebook Table of Content

Predicting Credit Card Fraud-پیش‌بینی کلاهبرداری کارت اعتباری Predicting Credit Card Fraud

  • 2.0 Business Problem Intro-مقدمه مسئله تجاری 2.0 Business Problem Intro

  • 2.1 Day 1 Intro-مقدمه روز اول 2.1 Day 1 Intro

  • 2.2 Day1 Pre-Modelling Prep-آماده‌سازی قبل از مدل‌سازی روز اول 2.2 Day1 Pre-Modelling Prep

  • 2.3 Day 1 Modelling Workflow-فرایند مدل‌سازی روز اول 2.3 Day 1 Modelling Workflow

  • 2.4 Day 1 Precision-at-recall metric-معیار دقت در بازیابی روز اول 2.4 Day 1 Precision-at-recall metric

  • 2.5 Day 2 Intro-مقدمه روز دوم 2.5 Day 2 Intro

  • 2.6 Day 2 Comparison of Resampling Techniques-مقایسه تکنیک‌های Resampling در روز دوم 2.6 Day 2 Comparison of Resampling Techniques

  • 2.7 Day 2 EDA & Cleaning for ML Generalizability-EDA و پاکسازی برای تعمیم‌پذیری ML در روز دوم 2.7 Day 2 EDA & Cleaning for ML Generalizability

  • 2.8 Day 3 Intro & Initialization-مقدمه و مقداردهی اولیه روز سوم 2.8 Day 3 Intro & Initialization

  • 2.9 Day 3 Feature Generation-تولید ویژگی‌ها در روز سوم 2.9 Day 3 Feature Generation

  • 2.10 Day 3 Feature Reduction-کاهش ویژگی‌ها در روز سوم 2.10 Day 3 Feature Reduction

  • 2.11 Day 3 Testing Performance on Engineered dataframe-آزمایش عملکرد روی Dataframe مهندسی‌شده در روز سوم 2.11 Day 3 Testing Performance on Engineered dataframe

  • 2.12 Day 4 Intro & Initialization-مقدمه و مقداردهی اولیه روز چهارم 2.12 Day 4 Intro & Initialization

  • 2.13 Day 4 Hyperparameter Tuning using GridSearchCV-تنظیم ابرپارامترها با استفاده از GridSearchCV در روز چهارم 2.13 Day 4 Hyperparameter Tuning using GridSearchCV

  • 2.14 Day 4 Test Performance-عملکرد تست در روز چهارم 2.14 Day 4 Test Performance

  • 2.15 Day 5 Intro & Initialization-مقدمه و مقداردهی اولیه روز پنجم 2.15 Day 5 Intro & Initialization

  • 2.16 Day 5 Hyperparameter Tuning Prep-آماده‌سازی تنظیم ابرپارامترها در روز پنجم 2.16 Day 5 Hyperparameter Tuning Prep

  • 2.17 Day 5 GridSearchCV on multiple Classifiers-GridSearchCV روی طبقه‌بندهای متعدد در روز پنجم 2.17 Day 5 GridSearchCV on multiple Classifiers

  • 2.18 Day 5 Ensemble using VotingClassifier-Ensemble با استفاده از VotingClassifier در روز پنجم 2.18 Day 5 Ensemble using VotingClassifier

  • 2.19 Test Ensemble Performance vs Day1-آزمایش عملکرد Ensemble در مقابل روز اول 2.19 Test Ensemble Performance vs Day1

  • 2.20 Recap and Summary-خلاصه و جمع‌بندی 2.20 Recap and Summary

Predicting Customer Churn-پیش‌بینی ریزش مشتری Predicting Customer Churn

  • 3.0 Business Problem Intro-مقدمه مسئله تجاری 3.0 Business Problem Intro

  • 3.1: Day 1 Intro-مقدمه روز اول 3.1: Day 1 Intro

  • 3.2 Day 1 Pre-Modelling Prep-آماده‌سازی قبل از مدل‌سازی در روز اول 3.2 Day 1 Pre-Modelling Prep

  • 3.3 Day 1 Precision at Recall Threshold-دقت در آستانه بازیابی در روز اول 3.3 Day 1 Precision at Recall Threshold

  • 3.4 Day 2 Intro and Setup-مقدمه و راه‌اندازی روز دوم 3.4 Day 2 Intro and Setup

  • 3.5 Day 2 Resampling Comparison-مقایسه Resampling در روز دوم 3.5 Day 2 Resampling Comparison

  • 3.6 EDA and Cleaning for ML Generalizability-EDA و پاکسازی برای تعمیم‌پذیری ML 3.6 EDA and Cleaning for ML Generalizability

  • 3.7 Day 2 Signal Amplification-تقویت سیگنال در روز دوم 3.7 Day 2 Signal Amplification

  • Homework: Repeat Day2 without the Null Imputations-تکلیف: تکرار روز دوم بدون Null Imputation Homework: Repeat Day2 without the Null Imputations

  • 3.8 Day 3 Feature Engineering-مهندسی ویژگی‌ها در روز سوم 3.8 Day 3 Feature Engineering

  • 3.9 Day 4 Hyperparameter Tuning-تنظیم ابرپارامترها در روز چهارم 3.9 Day 4 Hyperparameter Tuning

  • 3.10 Day 5: Ensemble Models-روز پنجم: مدل‌های Ensemble 3.10 Day 5: Ensemble Models

Predicting Financial Distress-پیش‌بینی ورشکستگی مالی Predicting Financial Distress

  • 4.0: Business Problem Intro-مقدمه مسئله تجاری 4.0: Business Problem Intro

  • 4.1 Day 1 Intro-مقدمه روز اول 4.1 Day 1 Intro

  • 4.2 Day 1 Modelling & Interpreting Results-مدل‌سازی و تفسیر نتایج روز اول 4.2 Day 1 Modelling & Interpreting Results

  • 4.3 Day 2 Resampling Method Selection-انتخاب روش Resampling در روز دوم 4.3 Day 2 Resampling Method Selection

  • 4.4 Day 2 Signal Amplification and Test Performance-تقویت سیگنال و عملکرد تست در روز دوم 4.4 Day 2 Signal Amplification and Test Performance

  • 4.5 Day 3 Feature Engineering-مهندسی ویژگی‌ها در روز سوم 4.5 Day 3 Feature Engineering

  • 4.6 Day 4 Hyperparameter Tuning of Random Forest-تنظیم ابرپارامترهای Random Forest در روز چهارم 4.6 Day 4 Hyperparameter Tuning of Random Forest

  • 4.7 Day 5 Ensemble Models-مدل‌های Ensemble در روز پنجم 4.7 Day 5 Ensemble Models

Helper functions library-کتابخانه توابع کمکی Helper functions library

  • 5.0 Helper functions python file-فایل پایتون توابع کمکی 5.0 Helper functions python file

  • 5.1 find_bad_columns_function()-تابع find_bad_columns_function() 5.1 find_bad_columns_function()

  • 5.2 custom_classification_metrics_function()-تابع custom_classification_metrics_function() 5.2 custom_classification_metrics_function()

  • 5.3 resample_and_test_performance_function()-تابع resample_and_test_performance_function() 5.3 resample_and_test_performance_function()

  • 5.4 augment_data_function()-تابع augment_data_function() 5.4 augment_data_function()

  • 5.5 numerical_distribution_function()-تابع numerical_distribution_function() 5.5 numerical_distribution_function()

  • 5.6 data_export_function()-تابع data_export_function() 5.6 data_export_function()

  • 5.7 reduce_mem_usage_function()-تابع reduce_mem_usage_function() 5.7 reduce_mem_usage_function()

  • 5.8 plot_feature_importances()-نمودار plot_feature_importances 5.8 plot_feature_importances()

  • 5.9 precision_at_recall_threshold_function ()-تابع precision_at_recall_threshold_function 5.9 precision_at_recall_threshold_function ()

  • 5.10 tune_grid_search_function()-تابع tune_grid_search_function 5.10 tune_grid_search_function()

Conclusion-نتیجه‌گیری Conclusion

  • Summary-خلاصه Summary

نمایش نظرات

آموزش صفر تا علوم داده چابک
جزییات دوره
3 hours
58
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
848
4.2 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Shreesha Jagadeesh Shreesha Jagadeesh

رهبر علم داده