🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش صفر تا علوم داده چابک
- آخرین آپدیت
دانلود Zero to Agile Data Science
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
یاد بگیرید چگونه به طور تکراری مدلهای علم داده را توسعه دهید
سرفصلهای دوره:
یادگیری ماشین
علم داده چابک
علم داده
دادههای نامتعادل
پیشبینی تقلب کارت اعتباری
پیشبینی ریزش مشتری
پیشبینی ورشکستگی مالی
مهندسی ویژگی
تنظیم ابرپارامترها
مدلهای ترکیبی
طبقهبندی دودویی
XGBoost
تشخیص ناهنجاری
پیشنیازها:
دانشجویان باید دورههای مقدماتی علم داده را گذرانده باشند تا با اجرای نوتبوکهای Jupyter در پایتون آشنا باشند.
آشنایی با بستههای scikit-learn.
دانشجو باید قادر به راهاندازی محیط Jupyter خود در لپتاپ یا در فضای ابری باشد.
در این دوره، شما یاد خواهید گرفت که چگونه تکنیکهای علم داده چابک را برای حل مسائل طبقهبندی از طریق 3 پروژه به کار ببرید: پیشبینی تقلب کارت اعتباری، پیشبینی ریزش مشتری و پیشبینی ورشکستگی مالی.
هر پروژه دارای 5 تکرار خواهد بود که با عنوان 'روز 1' تا 'روز 5' برچسبگذاری شدهاند و شما را به آرامی از یک طبقهبند Random Forest ساده به یک ensemble تنظیمشده از 5 طبقهبند (XGBoost, LightGBM, Gradient Boosted Decision Trees, Extra Trees و Random Forest) که بر روی دادههای upsampled ارزیابی شدهاند، میرساند.
این دوره برای دانشمندان داده متوسطهای که به دنبال گسترش مهارتهای خود در موارد زیر هستند، ایدهآل است:
تشخیص خودکار ستونهای بد در دادههای خام (روز 1)
ایجاد معیار (metric) خود برای مجموعهدادههای نامتعادل (روز 1)
چهار تکنیک Data Resampling (روز 2)
مدیریت مقادیر Null (روز 2)
دو تکنیک مهندسی ویژگی (روز 3)
چهار تکنیک کاهش ویژگی (روز 3)
کاهش ردپای حافظه (روز 3)
تنظیم یک تابع امتیازدهی سفارشی در داخل GridSearchCV (روز 4)
تغییر معیار امتیازدهی پیشفرض برای XGBoost (روز 5)
ساخت meta-model (روز 5)
نوتبوکهای Jupyter کامل با کد منبع و یک کتابخانه از توابع قابل استفاده مجدد در اختیار دانشآموزان قرار میگیرد تا در پروژههای خود در صورت نیاز استفاده کنند!
سرفصل ها و درس ها
Introduction-مقدمه
Introduction
1.0 Course Intro-مقدمه دوره
1.0 Course Intro
1.1 Course Audience-مخاطبان دوره
1.1 Course Audience
1.2 Course Overview-مرور کلی دوره
1.2 Course Overview
1.3 Course Benefits-مزایای دوره
1.3 Course Benefits
1.4 Course Setup-راهاندازی دوره
1.4 Course Setup
1.5 Formatting Jupyter Notebook Table of Content-قالببندی فهرست مطالب نوتبوک های Jupyter
1.5 Formatting Jupyter Notebook Table of Content
2.0 Business Problem Intro-مقدمه مسئله تجاری
2.0 Business Problem Intro
2.1 Day 1 Intro-مقدمه روز اول
2.1 Day 1 Intro
2.2 Day1 Pre-Modelling Prep-آمادهسازی قبل از مدلسازی روز اول
2.2 Day1 Pre-Modelling Prep
2.3 Day 1 Modelling Workflow-فرایند مدلسازی روز اول
2.3 Day 1 Modelling Workflow
2.4 Day 1 Precision-at-recall metric-معیار دقت در بازیابی روز اول
2.4 Day 1 Precision-at-recall metric
2.5 Day 2 Intro-مقدمه روز دوم
2.5 Day 2 Intro
2.6 Day 2 Comparison of Resampling Techniques-مقایسه تکنیکهای Resampling در روز دوم
2.6 Day 2 Comparison of Resampling Techniques
2.7 Day 2 EDA & Cleaning for ML Generalizability-EDA و پاکسازی برای تعمیمپذیری ML در روز دوم
2.7 Day 2 EDA & Cleaning for ML Generalizability
2.8 Day 3 Intro & Initialization-مقدمه و مقداردهی اولیه روز سوم
2.8 Day 3 Intro & Initialization
2.9 Day 3 Feature Generation-تولید ویژگیها در روز سوم
2.9 Day 3 Feature Generation
2.10 Day 3 Feature Reduction-کاهش ویژگیها در روز سوم
2.10 Day 3 Feature Reduction
2.11 Day 3 Testing Performance on Engineered dataframe-آزمایش عملکرد روی Dataframe مهندسیشده در روز سوم
2.11 Day 3 Testing Performance on Engineered dataframe
2.12 Day 4 Intro & Initialization-مقدمه و مقداردهی اولیه روز چهارم
2.12 Day 4 Intro & Initialization
2.13 Day 4 Hyperparameter Tuning using GridSearchCV-تنظیم ابرپارامترها با استفاده از GridSearchCV در روز چهارم
2.13 Day 4 Hyperparameter Tuning using GridSearchCV
2.14 Day 4 Test Performance-عملکرد تست در روز چهارم
2.14 Day 4 Test Performance
2.15 Day 5 Intro & Initialization-مقدمه و مقداردهی اولیه روز پنجم
2.15 Day 5 Intro & Initialization
2.16 Day 5 Hyperparameter Tuning Prep-آمادهسازی تنظیم ابرپارامترها در روز پنجم
2.16 Day 5 Hyperparameter Tuning Prep
2.17 Day 5 GridSearchCV on multiple Classifiers-GridSearchCV روی طبقهبندهای متعدد در روز پنجم
2.17 Day 5 GridSearchCV on multiple Classifiers
2.18 Day 5 Ensemble using VotingClassifier-Ensemble با استفاده از VotingClassifier در روز پنجم
2.18 Day 5 Ensemble using VotingClassifier
2.19 Test Ensemble Performance vs Day1-آزمایش عملکرد Ensemble در مقابل روز اول
2.19 Test Ensemble Performance vs Day1
2.20 Recap and Summary-خلاصه و جمعبندی
2.20 Recap and Summary
نمایش نظرات