آموزش مهندسی ویژگی برای یادگیری ماشین

Feature Engineering for Machine Learning

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: انتساب، رمزگذاری متغیر، گسسته سازی، استخراج ویژگی، نحوه کار با زمان تاریخ، نقاط پرت و موارد دیگر را بیاموزید. تکنیک های متعددی را برای انتساب داده های گمشده بیاموزید. متغیرهای طبقه بندی شده را به اعداد تبدیل کنید و در عین حال اطلاعات معناداری را به دست آورید. نحوه برخورد با دسته بندی های نادر، نادر و دیده نشده را بیاموزید. نحوه کار با متغیرهای اریب را یاد بگیرید. متغیرهای عددی را به متغیرهای گسسته تبدیل کنید. مقادیر پرت را از متغیرهای خود حذف کنید. ویژگی های مفید را از متغیرهای تاریخ و زمان استخراج کنید. تکنیک های مورد استفاده در سازمان ها در سراسر جهان و در مسابقات داده را بیاموزید. مجموعه تکنیک های خود را برای پیش پردازش داده ها و ساخت مدل های یادگیری ماشینی قدرتمندتر افزایش دهید. پیش نیازها: نصب پایتون. نصب نوت بوک Jupyter. مهارت های کدنویسی پایتون مقداری تجربه با Numpy و Pandas. آشنایی با الگوریتم های یادگیری ماشینی آشنایی با Scikit-Learn.

به Feature Engineering برای یادگیری ماشین خوش آمدید، جامع ترین دوره آموزشی در زمینه مهندسی ویژگی که به صورت آنلاین در دسترس است. در این دوره آموزشی، در مورد انتساب متغیر، رمزگذاری متغیر، تبدیل ویژگی، گسسته سازی، و نحوه ایجاد ویژگی های جدید از داده های خود خواهید آموخت.


مهندسی ویژگی اصلی و استخراج ویژگی.

در این دوره، چندین روش مهندسی ویژگی را یاد می گیرید که به شما امکان می دهد داده های خود را تغییر دهید و آنها را برای آموزش مدل های یادگیری ماشین آماده کنید. به طور خاص، شما یاد خواهید گرفت:


  • نحوه نسبت دادن داده های از دست رفته

  • نحوه کدگذاری متغیرهای طبقه بندی شده

  • نحوه تبدیل متغیرهای عددی و تغییر توزیع آنها

  • نحوه انجام گسسته سازی

  • نحوه حذف نقاط پرت

  • نحوه استخراج ویژگی ها از تاریخ و زمان

  • نحوه ایجاد ویژگی های جدید از ویژگی های موجود


ویژگی های مفیدی را با ریاضیات، آمار و دانش دامنه ایجاد کنید

مهندسی ویژگی فرآیند تبدیل ویژگی‌های موجود یا ایجاد متغیرهای جدید برای استفاده در یادگیری ماشین است. داده های خام برای آموزش الگوریتم های یادگیری ماشین مناسب نیستند. در عوض، دانشمندان داده زمان زیادی را به پیش پردازش داده ها اختصاص می دهند. این دوره همه چیزهایی را که باید بدانید تا داده های خود را برای آموزش مدل های خود آماده کنید، به شما می آموزد.


در حالی که اکثر دوره‌های آنلاین اصول مهندسی ویژگی‌ها را به شما آموزش می‌دهند، مانند وارد کردن متغیرها با میانگین یا تبدیل متغیرهای طبقه‌بندی با استفاده از یک رمزگذاری داغ، این دوره به شما این و خیلی چیزهای دیگر را آموزش می‌دهد.


در این دوره ابتدا با محبوب ترین و پرکاربردترین تکنیک ها برای مهندسی متغیرها، مانند میانگین و میانه انتساب، رمزگذاری تک داغ، تبدیل با لگاریتم و گسسته سازی آشنا می شوید. سپس، روش‌های پیشرفته‌تری را کشف خواهید کرد که اطلاعات را در حین رمزگذاری یا تغییر شکل متغیرهای شما برای بهبود عملکرد مدل‌های یادگیری ماشین، ضبط می‌کنند.


شما روش هایی مانند وزن شواهد مورد استفاده در امور مالی و نحوه ایجاد روابط یکنواخت بین متغیرها و اهداف برای افزایش عملکرد مدل های خطی را خواهید آموخت. همچنین یاد خواهید گرفت که چگونه ویژگی‌ها را از متغیرهای تاریخ و زمان ایجاد کنید و چگونه متغیرهای طبقه‌بندی را با دسته‌های زیاد مدیریت کنید.


روش هایی که یاد خواهید گرفت در مقالات علمی توضیح داده شده اند، در مسابقات علم داده استفاده می شوند و معمولاً در سازمان ها مورد استفاده قرار می گیرند. و علاوه بر این، آنها را می توان به راحتی با استفاده از کتابخانه های منبع باز پایتون پیاده سازی کرد!

در طول سخنرانی‌ها، توضیحات مفصلی در مورد هر تکنیک و بحثی در مورد مزایا، محدودیت‌ها و مفروضات اساسی آن‌ها و به دنبال آن بهترین شیوه‌های برنامه‌نویسی برای پیاده‌سازی آنها در پایتون خواهید یافت.


در پایان دوره، می‌توانید تصمیم بگیرید که بر اساس ویژگی‌های متغیر و مدل‌هایی که می‌خواهید آموزش دهید، به کدام تکنیک مهندسی ویژگی نیاز دارید. و همچنین در موقعیت مناسبی قرار خواهید داشت تا روش‌های مختلف تغییر شکل را آزمایش کنید و به مدل‌هایتان اجازه دهید تصمیم بگیرند که کدام یک بهترین کار را انجام می‌دهند.


شغل خود را در علم داده افزایش دهید

شما اولین قدم‌های خود را در علم داده برداشته‌اید. شما از متداول ترین مدل های پیش بینی استفاده می کنید. شما حتی چند مدل رگرسیون خطی یا طبقه بندی را آموزش داده اید. در این مرحله، احتمالاً شروع به یافتن چالش‌هایی کرده‌اید: داده‌های شما کثیف هستند، مقادیر زیادی از دست رفته‌اند، برخی از متغیرها عددی نیستند، و برخی دیگر به‌شدت منحرف هستند. همچنین ممکن است تعجب کنید که آیا کد شما کارآمد و کارآمد است یا راه بهتری برای برنامه‌نویسی وجود دارد. شما به صورت آنلاین جستجو می کنید، اما نمی توانید منابع تلفیقی را در زمینه مهندسی ویژگی پیدا کنید. شاید فقط وبلاگ ها؟ بنابراین ممکن است شروع به تعجب کنید: واقعاً کارها در شرکت های فناوری چگونه انجام می شود؟


در این دوره آموزشی، پاسخ این سوالات را خواهید یافت. در طول دوره، تکنیک های متعددی را برای جنبه های مختلف تبدیل متغیرها و نحوه پیاده سازی آنها به شیوه ای زیبا، کارآمد و حرفه ای با استفاده از پایتون یاد خواهید گرفت. شما از قدرت اکوسیستم منبع باز پایتون، از جمله کتابخانه‌های NumPy، Pandas، Scikit-learn و بسته‌های ویژه برای مهندسی ویژگی‌ها استفاده خواهید کرد: رمزگذارهای موتور ویژگی و دسته‌بندی.


در پایان دوره، می‌توانید تمام مراحل مهندسی ویژگی‌های خود را در یک خط لوله زیبا پیاده‌سازی کنید که به شما امکان می‌دهد مدل‌های پیش‌بینی‌کننده خود را با حداکثر کارایی وارد تولید کنید.


از قدرت منبع باز استفاده کنید

ما همه روش‌های مهندسی ویژگی را با استفاده از Pandas و Numpy انجام می‌دهیم، و پیاده‌سازی را با رمزگذارهای Scikit-learn، Feature-engine و Category مقایسه می‌کنیم و مزایا و محدودیت‌های هر کتابخانه را برجسته می‌کنیم. با پیشرفت در دوره، می توانید کتابخانه ای را که بیشتر دوست دارید برای انجام پروژه های خود انتخاب کنید.

یک نوت بوک اختصاصی پایتون با کد برای پیاده سازی هر روش مهندسی ویژگی وجود دارد که می توانید از آن در پروژه های خود برای سرعت بخشیدن به توسعه مدل های یادگیری ماشین خود استفاده مجدد کنید.


جامع ترین دوره آنلاین برای مهندسی ویژگی

هیچ مکان واحدی برای یادگیری در مورد مهندسی ویژگی وجود ندارد. این شامل ساعت‌ها جستجو در وب می‌شود تا بفهمید مردم برای استفاده حداکثری از داده‌های خود چه می‌کنند.


به همین دلیل است که این دوره تعداد زیادی از تکنیک‌های مورد استفاده در سراسر جهان را برای تبدیل ویژگی‌ها جمع‌آوری می‌کند، که از رقابت‌های داده در Kaggle و KDD، مقالات علمی، و از تجربه مربی به‌عنوان یک دانشمند داده آموخته شده‌اند. بنابراین، این دوره منبع مرجعی است که در آن می‌توانید روش‌های جدید را بیاموزید و همچنین تکنیک‌ها و کدهای مورد نیاز برای تغییر متغیرها را هر زمان که نیاز داشتید، دوباره مرور کنید.


این دوره توسط یک دانشمند داده پیشرو با تجربه در استفاده از یادگیری ماشین در امور مالی و بیمه تدریس می شود که همچنین نویسنده کتاب و توسعه دهنده اصلی کتابخانه منبع باز پایتون برای مهندسی ویژگی است. و موارد دیگر وجود دارد:


  • این دوره به طور مداوم به روز می شود تا شامل روش های جدید مهندسی ویژگی باشد.

  • نوت‌بوک‌ها مرتباً به‌روزرسانی می‌شوند تا اطمینان حاصل شود که همه روش‌ها با آخرین نسخه‌های کتابخانه‌های Python انجام می‌شوند، بنابراین کد شما هرگز خراب نمی‌شود.

  • این دوره ویدئوها، ارائه‌ها و نوت‌بوک‌های Jupyter را برای توضیح روش‌ها و نمایش اجرای آنها در پایتون ترکیب می‌کند.

  • برنامه درسی در یک دوره چهار ساله با تحقیقات مستمر در زمینه مهندسی ویژگی ایجاد شد تا آخرین فناوری‌ها، ابزارها و گرایش‌ها را به شما ارائه دهد.


آیا می خواهید بیشتر بدانید؟ ادامه مطلب...

این دوره جامع مهندسی ویژگی شامل بیش از 100 سخنرانی است که در حدود 10 ساعت ویدیو پخش شده است، و همه موضوعات شامل نمونه های عملی کد پایتون است که می توانید برای مرجع، تمرین و استفاده مجدد در پروژه های خود استفاده کنید.


به یاد داشته باشید، این دوره با 30 روز ضمانت بازگشت وجه ارائه می شود، بنابراین می توانید امروز بدون هیچ خطری ثبت نام کنید.


پس منتظر چه چیزی هستید؟ همین امروز ثبت نام کنید و به جامع ترین دوره مهندسی ویژگی برای یادگیری ماشین در جهان بپیوندید.


سرفصل ها و درس ها

خوش آمدی Welcome

  • مروری بر برنامه درسی دوره Course curriculum overview

خوش آمدی Welcome

  • مروری بر برنامه درسی دوره Course curriculum overview

  • الزامات دوره Course requirements

  • الزامات دوره Course requirements

  • نحوه برخورد با این دوره How to approach this course

  • نحوه برخورد با این دوره How to approach this course

  • راه اندازی کامپیوتر شما Setting up your computer

  • راه اندازی کامپیوتر شما Setting up your computer

مطالب دوره Course material

  • منابعی برای یادگیری مهارت های یادگیری ماشینی Resources to learn machine learning skills

مطالب دوره Course material

  • مطالب دوره Course material

  • مطالب دوره Course material

  • دانلود نوت بوک Jupyter Download Jupyter notebooks

  • دانلود نوت بوک Jupyter Download Jupyter notebooks

  • مجموعه داده ها را دانلود کنید Download datasets

  • مجموعه داده ها را دانلود کنید Download datasets

  • ارائه ها را دانلود کنید Download presentations

  • ارائه ها را دانلود کنید Download presentations

  • منابعی برای یادگیری مهارت های یادگیری ماشینی Resources to learn machine learning skills

انواع متغیر Variable Types

  • متغیرهای عددی Numerical variables

  • متغیرهای طبقه بندی شده Categorical variables

  • متغیرهای مختلط Mixed variables

انواع متغیر Variable Types

  • متغیرها | مقدمه Variables | Intro

  • متغیرها | مقدمه Variables | Intro

  • متغیرهای عددی Numerical variables

  • متغیرهای طبقه بندی شده Categorical variables

  • متغیرهای تاریخ و زمان Date and time variables

  • متغیرهای تاریخ و زمان Date and time variables

  • متغیرهای مختلط Mixed variables

ویژگی های متغیر Variable Characteristics

  • ویژگی های متغیر Variable characteristics

  • برچسب های کمیاب Rare labels

  • موارد پرت Outliers

  • مفروضات مدل های خطی Linear models assumptions

  • مفروضات مدل خطی - منابع خواندن اضافی (اختیاری) Linear model assumptions - additional reading resources (optional)

  • منابع خواندنی اضافی Additional reading resources

ویژگی های متغیر Variable Characteristics

  • ویژگی های متغیر Variable characteristics

  • داده های از دست رفته Missing data

  • داده های از دست رفته Missing data

  • قدرتمندی Cardinality

  • قدرتمندی Cardinality

  • برچسب های کمیاب Rare labels

  • توزیع متغیر Variable distribution

  • توزیع متغیر Variable distribution

  • موارد پرت Outliers

  • مفروضات مدل های خطی Linear models assumptions

  • مفروضات مدل خطی - منابع خواندن اضافی (اختیاری) Linear model assumptions - additional reading resources (optional)

  • قدر متغیر Variable magnitude

  • قدر متغیر Variable magnitude

  • جدول جمع بندی Summary table

  • جدول جمع بندی Summary table

  • منابع خواندنی اضافی Additional reading resources

داده‌های گمشده - پایه Missing Data Imputation - Basic

  • روش‌های اولیه انتساب Basic imputation methods

  • انتساب میانگین یا میانه Mean or median imputation

  • انتساب مکرر دسته بندی Frequent category imputation

  • روش های اساسی - ملاحظات Basic methods - considerations

  • انتساب اولیه با پانداها Basic imputation with pandas

  • انتساب اولیه با پانداها - نسخه ی نمایشی Basic imputation with pandas - demo

  • تعیین میانگین یا میانه با Scikit-learn Mean or median imputation with Scikit-learn

  • انتساب مقدار دلخواه با Scikit-learn Arbitrary value imputation with Scikit-learn

  • انتساب مکرر دسته بندی با Scikit-learn Frequent category imputation with Scikit-learn

  • اضافه کردن یک نشانگر گمشده با Scikit-learn Adding a missing indicator with Scikit-learn

  • Imputation با GrdiSearch - Scikit-learn Imputation with GrdiSearch - Scikit-learn

  • روش های اساسی با Feature-engine Basic methods with Feature-engine

  • محاسبه میانگین یا میانه با Feature-engine Mean or median imputation with Feature-engine

  • انتساب مقدار دلخواه با Feature-engine Arbitrary value imputation with Feature-engine

  • انتساب رشته دلخواه با Feature-engine Arbitrary string imputation with Feature-engine

  • بسته شدن Wrapping up

داده‌های گمشده - پایه Missing Data Imputation - Basic

  • روش‌های اولیه انتساب Basic imputation methods

  • انتساب میانگین یا میانه Mean or median imputation

  • انتساب ارزش دلخواه Arbitrary value imputation

  • انتساب ارزش دلخواه Arbitrary value imputation

  • انتساب مکرر دسته بندی Frequent category imputation

  • انتساب دسته وجود ندارد Missing category imputation

  • انتساب دسته وجود ندارد Missing category imputation

  • اضافه کردن یک نشانگر گم شده Adding a missing indicator

  • اضافه کردن یک نشانگر گم شده Adding a missing indicator

  • روش های اساسی - ملاحظات Basic methods - considerations

  • انتساب اولیه با پانداها Basic imputation with pandas

  • انتساب اولیه با پانداها - نسخه ی نمایشی Basic imputation with pandas - demo

  • روش های اساسی با Scikit-learn Basic methods with Scikit-learn

  • روش های اساسی با Scikit-learn Basic methods with Scikit-learn

  • تعیین میانگین یا میانه با Scikit-learn Mean or median imputation with Scikit-learn

  • انتساب مقدار دلخواه با Scikit-learn Arbitrary value imputation with Scikit-learn

  • انتساب مکرر دسته بندی با Scikit-learn Frequent category imputation with Scikit-learn

  • انتساب دسته با Scikit-learn وجود ندارد Missing category imputation with Scikit-learn

  • انتساب دسته با Scikit-learn وجود ندارد Missing category imputation with Scikit-learn

  • اضافه کردن یک نشانگر گمشده با Scikit-learn Adding a missing indicator with Scikit-learn

  • Imputation با GrdiSearch - Scikit-learn Imputation with GrdiSearch - Scikit-learn

  • روش های اساسی با Feature-engine Basic methods with Feature-engine

  • محاسبه میانگین یا میانه با Feature-engine Mean or median imputation with Feature-engine

  • انتساب مقدار دلخواه با Feature-engine Arbitrary value imputation with Feature-engine

  • انتساب مکرر دسته با Feature-engine Frequent category imputation with Feature-engine

  • انتساب مکرر دسته با Feature-engine Frequent category imputation with Feature-engine

  • انتساب رشته دلخواه با Feature-engine Arbitrary string imputation with Feature-engine

  • اضافه کردن یک نشانگر گمشده با Feature-engine Adding a missing indicator with Feature-engine

  • اضافه کردن یک نشانگر گمشده با Feature-engine Adding a missing indicator with Feature-engine

  • بسته شدن Wrapping up

داده های گمشده - روش های جایگزین Missing Data Imputation - Alternative Methods

  • تجزیه و تحلیل کامل پرونده Complete Case Analysis

  • پایان انتساب توزیع End of distribution imputation

  • انتساب نمونه تصادفی Random sample imputation

  • نسبت تصادفی - ملاحظات با کد Random imputation - considerations with code

  • میانگین یا میانه انتساب در هر گروه Mean or median imputation per group

  • میانگین انتساب در هر گروه با پانداها Mean imputation per group with pandas

  • پایان انتساب توزیع با Feature-engine End of distribution imputation with Feature-engine

  • انتساب نمونه تصادفی با Feature-engine Random sample imputation with Feature-engine

  • بسته شدن Wrapping up

داده های گمشده - روش های جایگزین Missing Data Imputation - Alternative Methods

  • روش های جایگزین جایگزین Alternative imputation methods

  • روش های جایگزین جایگزین Alternative imputation methods

  • تجزیه و تحلیل کامل پرونده Complete Case Analysis

  • CCA - ملاحظات با نسخه ی نمایشی کد CCA - considerations with code demo

  • CCA - ملاحظات با نسخه ی نمایشی کد CCA - considerations with code demo

  • پایان انتساب توزیع End of distribution imputation

  • انتساب نمونه تصادفی Random sample imputation

  • نسبت تصادفی - ملاحظات با کد Random imputation - considerations with code

  • میانگین یا میانه انتساب در هر گروه Mean or median imputation per group

  • CCA با پانداها CCA with pandas

  • CCA با پانداها CCA with pandas

  • پایان انتساب توزیع با پانداها End of distribution imputation with pandas

  • پایان انتساب توزیع با پانداها End of distribution imputation with pandas

  • نمونه گیری تصادفی با پانداها Random sample imputation with pandas

  • نمونه گیری تصادفی با پانداها Random sample imputation with pandas

  • میانگین انتساب در هر گروه با پانداها Mean imputation per group with pandas

  • CCA با ویژگی موتور CCA with Feature-engine

  • CCA با ویژگی موتور CCA with Feature-engine

  • پایان انتساب توزیع با Feature-engine End of distribution imputation with Feature-engine

  • انتساب نمونه تصادفی با Feature-engine Random sample imputation with Feature-engine

  • انتساب - جدول خلاصه Imputation - Summary table

  • انتساب - جدول خلاصه Imputation - Summary table

  • بسته شدن Wrapping up

چند متغیره از دست رفته داده Multivariate Missing Data Imputation

  • انتساب چند متغیره Multivariate imputation

  • انتساب KNN KNN imputation

  • missForest missForest

چند متغیره از دست رفته داده Multivariate Missing Data Imputation

  • انتساب چند متغیره Multivariate imputation

  • انتساب KNN KNN imputation

  • انتساب KNN - نسخه نمایشی KNN imputation - Demo

  • انتساب KNN - نسخه نمایشی KNN imputation - Demo

  • موش MICE

  • موش MICE

  • missForest missForest

  • MICE و missForest - نسخه ی نمایشی MICE and missForest - Demo

  • MICE و missForest - نسخه ی نمایشی MICE and missForest - Demo

  • منابع خواندنی اضافی (اختیاری) Additional reading resources (Optional)

  • منابع خواندنی اضافی (اختیاری) Additional reading resources (Optional)

رمزگذاری طبقه ای - روش های اساسی Categorical Encoding - Basic methods

  • رمزگذاری دسته بندی | معرفی Categorical encoding | Introduction

  • یک کدگذاری داغ با sklearn One hot encoding with sklearn

  • رمزگذاری ترتیبی با پانداها Ordinal encoding with pandas

  • رمزگذاری ترتیبی با رمزگذارهای دسته Ordinal encoding with Category encoders

  • شمارش رمزگذاری با پانداها Count encoding with pandas

  • شمارش رمزگذاری با رمزگذارهای دسته Count encoding with Category encoders

  • دسته بندی های دیده نشده Unseen categories

  • بسته شدن Wrapping up

رمزگذاری طبقه ای - روش های اساسی Categorical Encoding - Basic methods

  • رمزگذاری دسته بندی | معرفی Categorical encoding | Introduction

  • یک کدگذاری داغ One hot encoding

  • یک کدگذاری داغ One hot encoding

  • یک رمزگذاری داغ با پانداها One hot encoding with pandas

  • یک رمزگذاری داغ با پانداها One hot encoding with pandas

  • یک کدگذاری داغ با sklearn One hot encoding with sklearn

  • یک کدگذاری داغ با ویژگی موتور One hot encoding with Feature-engine

  • یک کدگذاری داغ با ویژگی موتور One hot encoding with Feature-engine

  • یک کدگذاری داغ با رمزگذارهای دسته One hot encoding with Category encoders

  • یک کدگذاری داغ با رمزگذارهای دسته One hot encoding with Category encoders

  • رمزگذاری ترتیبی Ordinal encoding

  • رمزگذاری ترتیبی Ordinal encoding

  • رمزگذاری ترتیبی با پانداها Ordinal encoding with pandas

  • رمزگذاری ترتیبی با sklearn Ordinal encoding with sklearn

  • رمزگذاری ترتیبی با sklearn Ordinal encoding with sklearn

  • رمزگذاری ترتیبی با Feature-engine Ordinal encoding with Feature-engine

  • رمزگذاری ترتیبی با Feature-engine Ordinal encoding with Feature-engine

  • رمزگذاری ترتیبی با رمزگذارهای دسته Ordinal encoding with Category encoders

  • رمزگذاری تعداد یا فرکانس Count or frequency encoding

  • رمزگذاری تعداد یا فرکانس Count or frequency encoding

  • شمارش رمزگذاری با پانداها Count encoding with pandas

  • شمارش رمزگذاری با ویژگی موتور Count encoding with Feature-engine

  • شمارش رمزگذاری با ویژگی موتور Count encoding with Feature-engine

  • شمارش رمزگذاری با رمزگذارهای دسته Count encoding with Category encoders

  • دسته بندی های دیده نشده Unseen categories

  • دسته بندی های دیده نشده Unseen categories

  • دسته بندی های دیده نشده Unseen categories

  • بسته شدن Wrapping up

رمزگذاری طبقه بندی شده - یکنواخت Categorical encoding - Monotonic

  • رمزگذاری دسته بندی | یکنواخت Categorical encoding | Monotonic

  • رمزگذاری ترتیبی مرتب شده است Ordered ordinal encoding

  • رمزگذاری ترتیبی با پانداها را سفارش داد Ordered ordinal encoding with pandas

  • میانگین رمزگذاری به علاوه صاف کردن - ویژگی موتور Mean encoding plus smoothing - Feature-engine

  • وزن شواهد (WoE) Weight of evidence (WoE)

  • وزن شواهد با پانداها Weight of Evidence with pandas

  • وزن شواهد با ویژگی موتور Weight of Evidence with Feature-engine

  • وزن شواهد با رمزگذارهای دسته Weight of Evidence with Category encoders

  • وزن شواهد - گوچا Weight of evidence - gotchas

  • دسته بندی های دیده نشده Unseen categories

  • مقایسه کدگذاری متغیرهای طبقه بندی شده Comparison of categorical variable encoding

  • منابع خواندنی اضافی Additional reading resources

رمزگذاری طبقه بندی شده - یکنواخت Categorical encoding - Monotonic

  • رمزگذاری دسته بندی | یکنواخت Categorical encoding | Monotonic

  • رمزگذاری ترتیبی مرتب شده است Ordered ordinal encoding

  • رمزگذاری ترتیبی با پانداها را سفارش داد Ordered ordinal encoding with pandas

  • رمزگذاری ترتیبی با Feature-engine دستور داد Ordered ordinal encoding with Feature-engine

  • رمزگذاری ترتیبی با Feature-engine دستور داد Ordered ordinal encoding with Feature-engine

  • رمزگذاری میانگین Mean encoding

  • رمزگذاری میانگین Mean encoding

  • معنی رمزگذاری با پانداها Mean encoding with pandas

  • معنی رمزگذاری با پانداها Mean encoding with pandas

  • میانگین رمزگذاری با Feature-engine Mean encoding with Feature-engine

  • میانگین رمزگذاری با Feature-engine Mean encoding with Feature-engine

  • میانگین رمزگذاری با رمزگذارهای دسته Mean encoding with Category encoders

  • میانگین رمزگذاری با رمزگذارهای دسته Mean encoding with Category encoders

  • رمزگذاری میانگین به علاوه صاف کردن Mean encoding plus smoothing

  • رمزگذاری میانگین به علاوه صاف کردن Mean encoding plus smoothing

  • میانگین رمزگذاری به علاوه صاف کردن - رمزگذارهای دسته Mean encoding plus smoothing - Category encoders

  • میانگین رمزگذاری به علاوه صاف کردن - رمزگذارهای دسته Mean encoding plus smoothing - Category encoders

  • میانگین رمزگذاری به علاوه صاف کردن - ویژگی موتور Mean encoding plus smoothing - Feature-engine

  • وزن شواهد (WoE) Weight of evidence (WoE)

  • وزن شواهد با پانداها Weight of Evidence with pandas

  • وزن شواهد با ویژگی موتور Weight of Evidence with Feature-engine

  • وزن شواهد با رمزگذارهای دسته Weight of Evidence with Category encoders

  • وزن شواهد - گوچا Weight of evidence - gotchas

  • دسته بندی های دیده نشده Unseen categories

  • بسته شدن Wrapping up

  • مقایسه کدگذاری متغیرهای طبقه بندی شده Comparison of categorical variable encoding

  • منابع خواندنی اضافی Additional reading resources

رمزگذاری طبقه بندی شده - برچسب های کمیاب Categorical encoding - Rare labels

  • گروه بندی برچسب های کمیاب Grouping rare labels

  • OHE از دسته های برتر با پانداها OHE of top categories with pandas

  • OHE از دسته های برتر با ویژگی موتور OHE of top categories with Feature-engine

  • OHE از دسته های برتر با sklearn OHE of top categories with sklearn

  • رمزگذاری برچسب نادر Rare label encoding

  • بسته شدن Wrapping up

رمزگذاری طبقه بندی شده - برچسب های کمیاب Categorical encoding - Rare labels

  • گروه بندی برچسب های کمیاب Grouping rare labels

  • یک رمزگذاری داغ از دسته های برتر One hot encoding of top categories

  • یک رمزگذاری داغ از دسته های برتر One hot encoding of top categories

  • OHE از دسته های برتر با پانداها OHE of top categories with pandas

  • OHE از دسته های برتر با ویژگی موتور OHE of top categories with Feature-engine

  • OHE از دسته های برتر با sklearn OHE of top categories with sklearn

  • رمزگذاری برچسب نادر Rare label encoding

  • رمزگذاری برچسب نادر با پانداها Rare label encoding with pandas

  • رمزگذاری برچسب نادر با پانداها Rare label encoding with pandas

  • رمزگذاری برچسب نادر با موتور ویژگی Rare label encoding with Feature-engine

  • رمزگذاری برچسب نادر با موتور ویژگی Rare label encoding with Feature-engine

  • بسته شدن Wrapping up

  • رمزگذاری طبقه بندی شده - بیشتر... Categorical encoding - More...

  • رمزگذاری طبقه بندی شده - بیشتر... Categorical encoding - More...

  • جدول خلاصه تکنیک های رمزگذاری Summary table of encoding techniques

  • جدول خلاصه تکنیک های رمزگذاری Summary table of encoding techniques

  • بسته شدن Wrapping up

تبدیل متغیر Variable Transformation

  • تبدیل متغیر - مقدمه Variable transformation - Introduction

  • تبدیل های متغیر Variable transformations

  • تبدیل باکس-کاکس Box-Cox transformation

  • دگرگونی یئو جانسون Yeo-Johnson transformation

  • متقابل با Numpy Reciprocal with Numpy

  • ریشه مربع با Numpy Square-root with Numpy

  • یئو جانسون با سایپی Yeo-Johnson with Scipy

  • تبدیل متقابل با اسکلرن Reciprocal transformation with sklearn

  • تبدیل قدرت با اسکلرن Power transformation with sklearn

  • تبدیل Box-Cox با sklearn Box-Cox transformation with sklearn

  • تبدیل لگاریتم با Feature-engine Logarithm transformation with Feature-engine

  • تبدیل متقابل با موتور ویژگی Reciprocal transformation with Feature-engine

  • تبدیل ریشه مربعی با موتور ویژگی Square-root transformation with Feature-engine

  • تبدیل Box-Cox با Feature-engine Box-Cox transformation with Feature-engine

  • تبدیل Yeo-Johnson با ویژگی موتور Yeo-Johnson transformation with Feature-engine

  • تبدیل Arcsin با ویژگی موتور Arcsin transformation with Feature-engine

  • بسته شدن Wrapping up

  • منابع خواندنی اضافی Additional reading resources

تبدیل متغیر Variable Transformation

  • تبدیل متغیر - مقدمه Variable transformation - Introduction

  • تبدیل های متغیر Variable transformations

  • تبدیل باکس-کاکس Box-Cox transformation

  • دگرگونی یئو جانسون Yeo-Johnson transformation

  • لگاریتم با Numpy Logarithm with Numpy

  • لگاریتم با Numpy Logarithm with Numpy

  • متقابل با Numpy Reciprocal with Numpy

  • ریشه مربع با Numpy Square-root with Numpy

  • تبدیل قدرت با Numpy Power transformation with Numpy

  • تبدیل قدرت با Numpy Power transformation with Numpy

  • باکس کاکس با اسکیپی Box-Cox with Scipy

  • باکس کاکس با اسکیپی Box-Cox with Scipy

  • یئو جانسون با سایپی Yeo-Johnson with Scipy

  • Arcsin با Numpy Arcsin with Numpy

  • Arcsin با Numpy Arcsin with Numpy

  • تبدیل لگاریتم با sklearn Logarithm transformation with sklearn

  • تبدیل لگاریتم با sklearn Logarithm transformation with sklearn

  • تبدیل متقابل با اسکلرن Reciprocal transformation with sklearn

  • تبدیل ریشه مربع با اسکلرن Square-root transformation with sklearn

  • تبدیل ریشه مربع با اسکلرن Square-root transformation with sklearn

  • تبدیل قدرت با اسکلرن Power transformation with sklearn

  • تبدیل Box-Cox با sklearn Box-Cox transformation with sklearn

  • تبدیل یئو جانسون با اسکلرن Yeo-Johnson transformation with sklearn

  • تبدیل یئو جانسون با اسکلرن Yeo-Johnson transformation with sklearn

  • تبدیل Arcsin با sklearn Arcsin transformation with sklearn

  • تبدیل Arcsin با sklearn Arcsin transformation with sklearn

  • تبدیل لگاریتم با Feature-engine Logarithm transformation with Feature-engine

  • تبدیل متقابل با موتور ویژگی Reciprocal transformation with Feature-engine

  • تبدیل ریشه مربعی با موتور ویژگی Square-root transformation with Feature-engine

  • تبدیل قدرت با ویژگی موتور Power transformation with Feature-engine

  • تبدیل قدرت با ویژگی موتور Power transformation with Feature-engine

  • تبدیل Box-Cox با Feature-engine Box-Cox transformation with Feature-engine

  • تبدیل Yeo-Johnson با ویژگی موتور Yeo-Johnson transformation with Feature-engine

  • تبدیل Arcsin با ویژگی موتور Arcsin transformation with Feature-engine

  • بسته شدن Wrapping up

  • منابع خواندنی اضافی Additional reading resources

گسسته سازی Discretisation

  • گسسته سازی با عرض مساوی Equal-width discretisation

  • مهم: ویژگی موتور نسخه 1.0.0 Important: Feature-engine v 1.0.0

  • گسسته سازی با فرکانس برابر Equal-frequency discretisation

  • ک-یعنی گسسته سازی| نسخه ی نمایشی K-means discretisation| Demo

  • گسسته سازی به علاوه رمزگذاری طبقه بندی شده Discretisation plus categorical encoding

  • منابع خواندنی اضافی Additional reading resources

گسسته سازی Discretisation

  • گسسته سازی | معرفی Discretisation | Introduction

  • گسسته سازی | معرفی Discretisation | Introduction

  • گسسته سازی با عرض مساوی Equal-width discretisation

  • مهم: ویژگی موتور نسخه 1.0.0 Important: Feature-engine v 1.0.0

  • گسسته سازی با عرض برابر | نسخه ی نمایشی Equal-width discretisation | Demo

  • گسسته سازی با عرض برابر | نسخه ی نمایشی Equal-width discretisation | Demo

  • گسسته سازی با فرکانس برابر Equal-frequency discretisation

  • گسسته سازی با فرکانس برابر | نسخه ی نمایشی Equal-frequency discretisation | Demo

  • گسسته سازی با فرکانس برابر | نسخه ی نمایشی Equal-frequency discretisation | Demo

  • K-به معنای گسستگی است K-means discretisation

  • K-به معنای گسستگی است K-means discretisation

  • ک-یعنی گسسته سازی| نسخه ی نمایشی K-means discretisation| Demo

  • گسسته سازی به علاوه رمزگذاری طبقه بندی شده Discretisation plus categorical encoding

  • گسسته سازی به علاوه رمزگذاری | نسخه ی نمایشی Discretisation plus encoding | Demo

  • گسسته سازی به علاوه رمزگذاری | نسخه ی نمایشی Discretisation plus encoding | Demo

  • گسسته سازی با درختان طبقه بندی Discretisation with classification trees

  • گسسته سازی با درختان طبقه بندی Discretisation with classification trees

  • گسسته سازی با درختان تصمیم با استفاده از Scikit-learn Discretisation with decision trees using Scikit-learn

  • گسسته سازی با درختان تصمیم با استفاده از Scikit-learn Discretisation with decision trees using Scikit-learn

  • گسسته سازی با درختان تصمیم با استفاده از موتور ویژگی Discretisation with decision trees using Feature-engine

  • گسسته سازی با درختان تصمیم با استفاده از موتور ویژگی Discretisation with decision trees using Feature-engine

  • گسسته سازی دانش دامنه Domain knowledge discretisation

  • گسسته سازی دانش دامنه Domain knowledge discretisation

  • منابع خواندنی اضافی Additional reading resources

کنترل دورتر Outlier Handling

  • مهندسی پرت | مقدمه Outlier Engineering | Intro

  • پیرایش بیرونی Outlier trimming

  • پوشش دور با IQR Outlier capping with IQR

  • محدودیت های خودسرانه Arbitrary capping

  • منابع خواندنی اضافی Additional reading resources

کنترل دورتر Outlier Handling

  • مهندسی پرت | مقدمه Outlier Engineering | Intro

  • پیرایش بیرونی Outlier trimming

  • پوشش دور با IQR Outlier capping with IQR

  • پوشش پرت با میانگین و std Outlier capping with mean and std

  • پوشش پرت با میانگین و std Outlier capping with mean and std

  • پوشش خارج از محدوده با چندک Outlier capping with quantiles

  • پوشش خارج از محدوده با چندک Outlier capping with quantiles

  • محدودیت های خودسرانه Arbitrary capping

  • مهم: ویژگی موتور نسخه 1.0.0 Important: Feature-engine v1.0.0

  • مهم: ویژگی موتور نسخه 1.0.0 Important: Feature-engine v1.0.0

  • منابع خواندنی اضافی Additional reading resources

مقیاس بندی ویژگی ها Feature Scaling

  • حداکثر مقیاس بندی مطلق Maximum absolute scaling

  • پوسته پوسته شدن قوی | نسخه ی نمایشی Robust Scaling | Demo

  • مقیاس بندی به طول واحد برداری | نسخه ی نمایشی Scaling to vector unit length | Demo

  • منابع خواندنی اضافی Additional reading resources

مقیاس بندی ویژگی ها Feature Scaling

  • مقیاس بندی ویژگی | معرفی Feature scaling | Introduction

  • مقیاس بندی ویژگی | معرفی Feature scaling | Introduction

  • استاندارد سازی Standardisation

  • استاندارد سازی Standardisation

  • استانداردسازی | نسخه ی نمایشی Standardisation | Demo

  • استانداردسازی | نسخه ی نمایشی Standardisation | Demo

  • میانگین عادی سازی Mean normalisation

  • میانگین عادی سازی Mean normalisation

  • میانگین نرمال سازی | نسخه ی نمایشی Mean normalisation | Demo

  • میانگین نرمال سازی | نسخه ی نمایشی Mean normalisation | Demo

  • مقیاس بندی به مقادیر حداقل و حداکثر Scaling to minimum and maximum values

  • مقیاس بندی به مقادیر حداقل و حداکثر Scaling to minimum and maximum values

  • MinMaxScaling | نسخه ی نمایشی MinMaxScaling | Demo

  • MinMaxScaling | نسخه ی نمایشی MinMaxScaling | Demo

  • حداکثر مقیاس بندی مطلق Maximum absolute scaling

  • MaxAbsScaling | نسخه ی نمایشی MaxAbsScaling | Demo

  • MaxAbsScaling | نسخه ی نمایشی MaxAbsScaling | Demo

  • مقیاس بندی به میانه و چندک Scaling to median and quantiles

  • مقیاس بندی به میانه و چندک Scaling to median and quantiles

  • پوسته پوسته شدن قوی | نسخه ی نمایشی Robust Scaling | Demo

  • مقیاس بندی به طول واحد برداری Scaling to vector unit length

  • مقیاس بندی به طول واحد برداری Scaling to vector unit length

  • مقیاس بندی به طول واحد برداری | نسخه ی نمایشی Scaling to vector unit length | Demo

  • منابع خواندنی اضافی Additional reading resources

متغیرهای ترکیبی مهندسی Engineering mixed variables

  • متغیرهای ترکیبی مهندسی Engineering mixed variables

  • متغیرهای ترکیبی مهندسی | نسخه ی نمایشی Engineering mixed variables | Demo

متغیرهای ترکیبی مهندسی Engineering mixed variables

  • متغیرهای ترکیبی مهندسی Engineering mixed variables

  • متغیرهای ترکیبی مهندسی | نسخه ی نمایشی Engineering mixed variables | Demo

متغیرهای مهندسی تاریخ Engineering datetime variables

  • متغیرهای مهندسی تاریخ Engineering datetime variables

  • متغیرهای زمانی مهندسی و مناطق زمانی مختلف Engineering time variables and different timezones

متغیرهای مهندسی تاریخ Engineering datetime variables

  • متغیرهای مهندسی تاریخ Engineering datetime variables

  • تاریخ های مهندسی | نسخه ی نمایشی Engineering dates | Demo

  • تاریخ های مهندسی | نسخه ی نمایشی Engineering dates | Demo

  • متغیرهای زمانی مهندسی و مناطق زمانی مختلف Engineering time variables and different timezones

مونتاژ خط لوله مهندسی ویژگی Assembling a feature engineering pipeline

  • همه اش را بگذار کنار هم Putting it all together

  • خط لوله مهندسی ویژگی Feature Engineering Pipeline

  • ویژگی خط لوله مهندسی با اعتبارسنجی متقابل Feature engineering pipeline with cross-validation

مونتاژ خط لوله مهندسی ویژگی Assembling a feature engineering pipeline

  • همه اش را بگذار کنار هم Putting it all together

  • خط لوله مهندسی ویژگی Feature Engineering Pipeline

  • خط لوله طبقه بندی Classification pipeline

  • خط لوله طبقه بندی Classification pipeline

  • خط لوله رگرسیون Regression pipeline

  • خط لوله رگرسیون Regression pipeline

  • عملکرد مدل ML من را با ویژگی های مهندسی شکست دهید! Beat the performance of my ML model by engineering features!!!

  • عملکرد مدل ML من را با ویژگی های مهندسی شکست دهید! Beat the performance of my ML model by engineering features!!!

  • ویژگی خط لوله مهندسی با اعتبارسنجی متقابل Feature engineering pipeline with cross-validation

  • نمونه های بیشتر More examples

  • نمونه های بیشتر More examples

بخش پایانی | مراحل بعدی Final section | Next steps

  • نظر سنجی Survey

  • تبریک می گویم Congratulations

  • سخنرانی پاداش Bonus lecture

بخش پایانی | مراحل بعدی Final section | Next steps

  • نظر سنجی Survey

  • تبریک می گویم Congratulations

  • سخنرانی پاداش Bonus lecture

نمایش نظرات

آموزش مهندسی ویژگی برای یادگیری ماشین
جزییات دوره
13.5 hours
197
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
19,700
4.8 از 5
دارد
دارد
دارد
Soledad Galli
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Soledad Galli Soledad Galli

دانشمند داده | مربی | توسعه دهنده نرم افزار