آموزش Zero to Agile Data Science

Zero to Agile Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: بیاموزید که چگونه به طور مکرر مدل های علم داده را توسعه دهید یادگیری ماشینی علم اطلاعات چابک علم داده ها داده های نامتعادل پیش بینی تقلب در کارت اعتباری پیش بینی انحراف مشتری پیش بینی مشکلات مالی ویژگی مهندسی Hyperparameter تنظیم مجموعه مدل ها طبقه بندی باینری XGBoost تشخیص ناهنجاری پیش نیازها:دانشجویان باید دوره های علوم داده را گذرانده باشند. آشنایی با اجرای نوت‌بوک‌های Jupyter در پایتون آشنایی با بسته‌های Sicit-Learn دانش‌آموز باید بتواند محیط Jupyter خود را در لپ‌تاپ یا در فضای ابری راه‌اندازی کند.

شما یاد خواهید گرفت که چگونه تکنیک های Agile Data Science را در مسائل طبقه بندی از طریق 3 پروژه - پیش بینی تقلب در کارت اعتباری، پیش بینی ریزش مشتری و پیش بینی ناراحتی مالی، به کار ببرید.

هر پروژه دارای 5 تکرار با برچسب "روز 1" تا "روز 5" است که به آرامی شما را از یک طبقه‌بندی‌کننده جنگل تصادفی ساده به مجموعه‌ای تنظیم‌شده از 5 طبقه‌بندی کننده (XGBoost، LightGBM، درختان تصمیم‌گیری تقویت‌شده با گرادیان، درختان اضافی و جنگل تصادفی) بر اساس داده‌های نمونه‌برداری شده ارزیابی شد.

این دوره برای دانشمندان داده های متوسط ​​که به دنبال گسترش مهارت های خود با موارد زیر هستند ایده آل است:

  1. تشخیص خودکار ستون‌های بد در داده‌های خام ما (روز 1)

  2. ایجاد معیار خود برای مجموعه داده های نامتعادل (روز 1)

  3. چهار تکنیک نمونه‌گیری مجدد داده (روز دوم)

  4. بررسی نال ها (روز 2)

  5. دو تکنیک مهندسی ویژه (روز 3)

  6. چهار تکنیک کاهش ویژگی (روز 3)

  7. کاهش ردپای حافظه (روز 3)

  8. تنظیم یک تابع امتیازدهی سفارشی در GridSearchCV (روز 4)

  9. تغییر معیار امتیازدهی پیش‌فرض برای XGBoost (روز 5)

  10. ساخت متا مدل (روز پنجم)

نوت‌بوک‌های کامل Jupyter با کد منبع و کتابخانه‌ای از توابع قابل استفاده مجدد در اختیار دانش‌آموزان قرار می‌گیرد تا در صورت نیاز در پروژه‌های خود استفاده کنند!


سرفصل ها و درس ها

معرفی Introduction

  • 1.0 معرفی دوره 1.0 Course Intro

  • 1.1 مخاطب دوره 1.1 Course Audience

  • 1.2 بررسی اجمالی دوره 1.2 Course Overview

  • 1.3 مزایای دوره 1.3 Course Benefits

  • 1.4 راه اندازی دوره 1.4 Course Setup

  • 1.5 قالب بندی فهرست مطالب نوت بوک Jupyter 1.5 Formatting Jupyter Notebook Table of Content

پیش بینی کلاهبرداری از کارت اعتباری Predicting Credit Card Fraud

  • 2.0 معرفی مشکل کسب و کار 2.0 Business Problem Intro

  • 2.1 روز اول معرفی 2.1 Day 1 Intro

  • 2.2 روز 1 آماده سازی پیش از مدل سازی 2.2 Day1 Pre-Modelling Prep

  • 2.3 روز اول گردش کار مدل سازی 2.3 Day 1 Modelling Workflow

  • 2.4 روز 1 متریک دقت در فراخوان 2.4 Day 1 Precision-at-recall metric

  • 2.5 روز دوم معرفی 2.5 Day 2 Intro

  • 2.6 روز دوم مقایسه تکنیک های نمونه گیری مجدد 2.6 Day 2 Comparison of Resampling Techniques

  • 2.7 روز 2 EDA & Cleaning برای تعمیم پذیری ML 2.7 Day 2 EDA & Cleaning for ML Generalizability

  • 2.8 روز 3 معرفی و راه اندازی 2.8 Day 3 Intro & Initialization

  • 2.9 روز 3 نسل ویژگی 2.9 Day 3 Feature Generation

  • 2.10 روز 3 کاهش ویژگی 2.10 Day 3 Feature Reduction

  • 2.11 روز 3 عملکرد تست در چارچوب داده مهندسی شده 2.11 Day 3 Testing Performance on Engineered dataframe

  • 2.12 روز 4 معرفی و راه اندازی 2.12 Day 4 Intro & Initialization

  • 2.13 تنظیم فراپارامتر روز چهارم با استفاده از GridSearchCV 2.13 Day 4 Hyperparameter Tuning using GridSearchCV

  • 2.14 روز چهارم عملکرد آزمون 2.14 Day 4 Test Performance

  • 2.15 روز پنجم مقدمه و راه اندازی 2.15 Day 5 Intro & Initialization

  • 2.16 روز پنجم آماده سازی تنظیم فراپارامتر 2.16 Day 5 Hyperparameter Tuning Prep

  • 2.17 روز 5 GridSearchCV در طبقه بندی کننده های متعدد 2.17 Day 5 GridSearchCV on multiple Classifiers

  • 2.18 روز 5 گروه با استفاده از VotingClassifier 2.18 Day 5 Ensemble using VotingClassifier

  • 2.19 عملکرد گروه تست در مقابل روز 1 2.19 Test Ensemble Performance vs Day1

  • 2.20 خلاصه و خلاصه 2.20 Recap and Summary

پیش بینی ریزش مشتری Predicting Customer Churn

  • 3.0 معرفی مشکل کسب و کار 3.0 Business Problem Intro

  • 3.1: روز اول معرفی 3.1: Day 1 Intro

  • 3.2 روز 1 آماده سازی پیش از مدل سازی 3.2 Day 1 Pre-Modelling Prep

  • 3.3 روز 1 دقت در آستانه فراخوان 3.3 Day 1 Precision at Recall Threshold

  • 3.4 روز دوم معرفی و راه اندازی 3.4 Day 2 Intro and Setup

  • 3.5 روز دوم مقایسه نمونه گیری مجدد 3.5 Day 2 Resampling Comparison

  • 3.6 EDA و Cleaning برای تعمیم پذیری ML 3.6 EDA and Cleaning for ML Generalizability

  • 3.7 روز 2 تقویت سیگنال 3.7 Day 2 Signal Amplification

  • تکلیف خانه: روز 2 را بدون تخصیص تهی تکرار کنید Homework: Repeat Day2 without the Null Imputations

  • 3.8 روز 3 مهندسی ویژگی 3.8 Day 3 Feature Engineering

  • تنظیم فراپارامتر 3.9 روز 4 3.9 Day 4 Hyperparameter Tuning

  • 3.10 روز 5: مدل های گروه 3.10 Day 5: Ensemble Models

پیش بینی مشکلات مالی Predicting Financial Distress

  • 4.0: معرفی مشکلات تجاری 4.0: Business Problem Intro

  • 4.1 روز اول معرفی 4.1 Day 1 Intro

  • 4.2 روز اول مدل سازی و تفسیر نتایج 4.2 Day 1 Modelling & Interpreting Results

  • 4.3 روز دوم انتخاب روش نمونه گیری مجدد 4.3 Day 2 Resampling Method Selection

  • 4.4 روز 2 تقویت سیگنال و عملکرد تست 4.4 Day 2 Signal Amplification and Test Performance

  • 4.5 روز 3 مهندسی ویژگی 4.5 Day 3 Feature Engineering

  • 4.6 روز 4 تنظیم فراپارامتر جنگل تصادفی 4.6 Day 4 Hyperparameter Tuning of Random Forest

  • 4.7 روز 5 مدل های گروه 4.7 Day 5 Ensemble Models

کتابخانه توابع کمکی Helper functions library

  • 5.0 فایل پایتون توابع کمکی 5.0 Helper functions python file

  • 5.1 find_bad_columns_function() 5.1 find_bad_columns_function()

  • 5.2 custom_classification_metrics_function() 5.2 custom_classification_metrics_function()

  • 5.3 resample_and_test_performance_function() 5.3 resample_and_test_performance_function()

  • 5.4 augment_data_function() 5.4 augment_data_function()

  • 5.5 numerical_distribution_function() 5.5 numerical_distribution_function()

  • 5.6 data_export_function() 5.6 data_export_function()

  • 5.7 reduce_mem_usage_function() 5.7 reduce_mem_usage_function()

  • 5.8 plot_feature_importances() 5.8 plot_feature_importances()

  • 5.9 precision_at_recal_threshold_function () 5.9 precision_at_recall_threshold_function ()

  • 5.10 tune_grid_search_function() 5.10 tune_grid_search_function()

نتیجه Conclusion

  • خلاصه Summary

نمایش نظرات

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.

آموزش Zero to Agile Data Science
جزییات دوره
3 hours
58
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
790
4 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Shreesha Jagadeesh Shreesha Jagadeesh

رهبر علم داده