نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
این دوره تکنیک های مختلفی را برای رمزگذاری داده های دسته بندی ، از اشکال آشنای رمزگذاری یکپارچه و برچسب ، قبل از انتقال به طرح های برنامه نویسی کنتراست مانند کدگذاری ساده ، کدگذاری Helmert و کدگذاری چند جمله ای متعامد ، شامل می شود. کیفیت پیش پردازش داده های عددی برای تعیین کننده مهم نتایج مدلهای یادگیری ماشین که با استفاده از آن داده ها ساخته شده اند. در این دوره ، Building Features from Nominal Data ، توانایی رمزگذاری داده های دسته بندی را از طریق روشهایی که قدرت آماری مدلها را افزایش می دهد ، بدست خواهید آورد. ابتدا انواع مختلف داده های مداوم و طبقه ای و تفاوت بین داده های نسبت و مقیاس فاصله ای و داده های اسمی و ترتیبی را خواهید آموخت. در مرحله بعدی ، شما نحوه رمزگذاری داده های دسته بندی را با استفاده از رمزگذاری یکپارچه و برچسب ، و چگونگی جلوگیری از دام متغیر ساختگی در رگرسیون خطی ، کشف خواهید کرد. سرانجام ، شما نحوه پیاده سازی اشکال مختلف کدگذاری کنتراست - مانند کدگذاری چند جمله ای ساده ، هلمرتی و متعامد را کشف خواهید کرد ، به طوری که نتایج رگرسیون فرضیه هایی را که می خواهید آزمایش کنید از نزدیک آینه می کند. پس از پایان این دوره ، مهارت و دانش رمزگذاری داده های دسته ای مورد نیاز برای افزایش قدرت آماری رگرسیون خطی را که شامل چنین داده هایی است ، خواهید داشت.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
پیاده سازی رویکردهای کار با داده های دسته ای
Implementing Approaches to Working with Categorical Data
-
بررسی اجمالی ماژول
Module Overview
-
پیش نیازها و طرح کلی دوره
Prerequisites and Course Outline
-
داده های مداوم و دسته ای
Continuous and Categorical Data
-
داده های عددی
Numeric Data
-
داده های دسته بندی شده
Categorical Data
-
رمزگذاری برچسب و رمزگذاری یک گرم
Label Encoding and One-hot Encoding
-
انتخاب بین رمزگذاری برچسب و رمزگذاری یک گرم
Choosing between Label Encoding and One-hot Encoding
-
انواع وظایف طبقه بندی
Types of Classification Tasks
-
کدگذاری داغ با دسته های شناخته شده و ناشناخته
One-hot Encoding with Known and Unknown Categories
-
رمزگذاری داغ روی ستون قاب داده Pandas
One-hot Encoding on a Pandas Data Frame Column
-
کدگذاری داغ با استفاده از pd.get_dummies ()
One-hot Encoding Using pd.get_dummies()
-
رمزگذاری برچسب برای تبدیل داده های دسته بندی به حالت عادی
Label Encoding to Convert Categorical Data to Ordinal
-
Binarizer را برای اجرای رمزگذاری در مقابل بقیه اهداف انتخاب کنید
Label Binarizer to Perform One vs. Rest Encoding of Targets
-
Binarizer چند برچسب برای رمزگذاری اهداف چند برچسب
Multilabel Binarizer for Encoding Multilabel Targets
-
خلاصه ماژول
Module Summary
درک و اجرای برنامه نویسی ساختگی
Understanding and Implementing Dummy Coding
-
بررسی اجمالی ماژول
Module Overview
-
دام ساختگی
The Dummy Trap
-
اجتناب از دام ساختگی
Avoiding the Dummy Trap
-
رمزگذاری ساختگی برای غلبه بر محدودیت های رمزگذاری یک بار داغ
Dummy Coding to Overcome Limitations of One-hot Encoding
-
تحلیل رگرسیون با کدگذاری ساختگی یا درمان
Regression Analysis with Dummy or Treatment Coding
-
رمزگذاری ساختگی با استفاده از Patsy
Dummy Coding Using Patsy
-
تجزیه و تحلیل رگرسیون را با استفاده از یادگیری ماشین در دسته بندی های ساختگی ساختگی انجام دهید
Perform Regression Analysis Using Machine Learning on Dummy Coded Categories
-
انجام رگرسیون خطی با استفاده از یادگیری ماشینی با دسته های رمزگذاری شده داغ
Performing Linear Regression Using Machine Learning with One-hot Encoded Categories
-
خلاصه ماژول
Module Summary
درک و اجرای کدگذاری کنتراست
Understanding and Implementing Contrast Coding
-
بررسی اجمالی ماژول
Module Overview
-
کدگذاری ساختگی در مقابل کدگذاری کنتراست
Dummy Coding vs. Contrast Coding
-
کاوش تکنیک های کدگذاری کنتراست
Exploring Contrast Coding Techniques
-
تحلیل رگرسیون با استفاده از کدگذاری اثر ساده
Regression Analysis Using Simple Effect Coding
-
انجام رگرسیون خطی با استفاده از یادگیری ماشینی با کدگذاری اثر ساده
Performing Linear Regression Using Machine Learning with Simple Effect Coding
-
رگرسیون با استفاده از رمزگذاری تفاوت عقب مانده
Regression Using Backward Difference Encoding
-
رگرسیون با استفاده از رمزگذاری هلمرت
Regression Using Helmert Encoding
-
ایجاد دسته های مساوی با فاصله برای انجام رمزگذاری چند جمله ای متعامد
Generating Equally Spaced Categories to Perform Orthogonal Polynomial Encoding
-
انجام تحلیل رگرسیون با استفاده از رمزگذاری چند جمله ای متعامد
Performing Regression Analysis Using Orthogonal Polynomial Encoding
-
خلاصه ماژول
Module Summary
اجرای شمارش سطل و ویژگی های هش
Implementing Bin Counting and Feature Hashing
-
بررسی اجمالی ماژول
Module Overview
-
سطل زنی داده های مداوم
Bucketing Continuous Data
-
سطل زنی داده های مداوم با استفاده از Pandas
Bucketing Continuous Data Using Pandas
-
طبقه بندی داده های مداوم با استفاده از KBinsDiscretizer
Categorizing Continuous Data Using the KBinsDiscretizer
-
هش کردن
Hashing
-
هش کردن ویژگی ها با واژه نامه ها ، Tuples و داده های متنی
Feature Hashing with Dictionaries, Tuples, and Text Data
-
ساخت یک مدل رگرسیون ساده با استفاده از مقادیر طبقه بندی شده هاشده
Building a Simple Regression Model Using Hashed Categorical Values
-
خلاصه و مطالعه بیشتر
Summary and Further Study
نمایش نظرات