آموزش ویژگی های ساختمان از داده های اسمی

Building Features from Nominal Data

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: این دوره تکنیک های مختلفی را برای رمزگذاری داده های دسته بندی ، از اشکال آشنای رمزگذاری یکپارچه و برچسب ، قبل از انتقال به طرح های برنامه نویسی کنتراست مانند کدگذاری ساده ، کدگذاری Helmert و کدگذاری چند جمله ای متعامد ، شامل می شود. کیفیت پیش پردازش داده های عددی برای تعیین کننده مهم نتایج مدلهای یادگیری ماشین که با استفاده از آن داده ها ساخته شده اند. در این دوره ، Building Features from Nominal Data ، توانایی رمزگذاری داده های دسته بندی را از طریق روشهایی که قدرت آماری مدلها را افزایش می دهد ، بدست خواهید آورد. ابتدا انواع مختلف داده های مداوم و طبقه ای و تفاوت بین داده های نسبت و مقیاس فاصله ای و داده های اسمی و ترتیبی را خواهید آموخت. در مرحله بعدی ، شما نحوه رمزگذاری داده های دسته بندی را با استفاده از رمزگذاری یکپارچه و برچسب ، و چگونگی جلوگیری از دام متغیر ساختگی در رگرسیون خطی ، کشف خواهید کرد. سرانجام ، شما نحوه پیاده سازی اشکال مختلف کدگذاری کنتراست - مانند کدگذاری چند جمله ای ساده ، هلمرتی و متعامد را کشف خواهید کرد ، به طوری که نتایج رگرسیون فرضیه هایی را که می خواهید آزمایش کنید از نزدیک آینه می کند. پس از پایان این دوره ، مهارت و دانش رمزگذاری داده های دسته ای مورد نیاز برای افزایش قدرت آماری رگرسیون خطی را که شامل چنین داده هایی است ، خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

پیاده سازی رویکردهای کار با داده های دسته ای Implementing Approaches to Working with Categorical Data

  • بررسی اجمالی ماژول Module Overview

  • پیش نیازها و طرح کلی دوره Prerequisites and Course Outline

  • داده های مداوم و دسته ای Continuous and Categorical Data

  • داده های عددی Numeric Data

  • داده های دسته بندی شده Categorical Data

  • رمزگذاری برچسب و رمزگذاری یک گرم Label Encoding and One-hot Encoding

  • انتخاب بین رمزگذاری برچسب و رمزگذاری یک گرم Choosing between Label Encoding and One-hot Encoding

  • انواع وظایف طبقه بندی Types of Classification Tasks

  • کدگذاری داغ با دسته های شناخته شده و ناشناخته One-hot Encoding with Known and Unknown Categories

  • رمزگذاری داغ روی ستون قاب داده Pandas One-hot Encoding on a Pandas Data Frame Column

  • کدگذاری داغ با استفاده از pd.get_dummies () One-hot Encoding Using pd.get_dummies()

  • رمزگذاری برچسب برای تبدیل داده های دسته بندی به حالت عادی Label Encoding to Convert Categorical Data to Ordinal

  • Binarizer را برای اجرای رمزگذاری در مقابل بقیه اهداف انتخاب کنید Label Binarizer to Perform One vs. Rest Encoding of Targets

  • Binarizer چند برچسب برای رمزگذاری اهداف چند برچسب Multilabel Binarizer for Encoding Multilabel Targets

  • خلاصه ماژول Module Summary

درک و اجرای برنامه نویسی ساختگی Understanding and Implementing Dummy Coding

  • بررسی اجمالی ماژول Module Overview

  • دام ساختگی The Dummy Trap

  • اجتناب از دام ساختگی Avoiding the Dummy Trap

  • رمزگذاری ساختگی برای غلبه بر محدودیت های رمزگذاری یک بار داغ Dummy Coding to Overcome Limitations of One-hot Encoding

  • تحلیل رگرسیون با کدگذاری ساختگی یا درمان Regression Analysis with Dummy or Treatment Coding

  • رمزگذاری ساختگی با استفاده از Patsy Dummy Coding Using Patsy

  • تجزیه و تحلیل رگرسیون را با استفاده از یادگیری ماشین در دسته بندی های ساختگی ساختگی انجام دهید Perform Regression Analysis Using Machine Learning on Dummy Coded Categories

  • انجام رگرسیون خطی با استفاده از یادگیری ماشینی با دسته های رمزگذاری شده داغ Performing Linear Regression Using Machine Learning with One-hot Encoded Categories

  • خلاصه ماژول Module Summary

درک و اجرای کدگذاری کنتراست Understanding and Implementing Contrast Coding

  • بررسی اجمالی ماژول Module Overview

  • کدگذاری ساختگی در مقابل کدگذاری کنتراست Dummy Coding vs. Contrast Coding

  • کاوش تکنیک های کدگذاری کنتراست Exploring Contrast Coding Techniques

  • تحلیل رگرسیون با استفاده از کدگذاری اثر ساده Regression Analysis Using Simple Effect Coding

  • انجام رگرسیون خطی با استفاده از یادگیری ماشینی با کدگذاری اثر ساده Performing Linear Regression Using Machine Learning with Simple Effect Coding

  • رگرسیون با استفاده از رمزگذاری تفاوت عقب مانده Regression Using Backward Difference Encoding

  • رگرسیون با استفاده از رمزگذاری هلمرت Regression Using Helmert Encoding

  • ایجاد دسته های مساوی با فاصله برای انجام رمزگذاری چند جمله ای متعامد Generating Equally Spaced Categories to Perform Orthogonal Polynomial Encoding

  • انجام تحلیل رگرسیون با استفاده از رمزگذاری چند جمله ای متعامد Performing Regression Analysis Using Orthogonal Polynomial Encoding

  • خلاصه ماژول Module Summary

اجرای شمارش سطل و ویژگی های هش Implementing Bin Counting and Feature Hashing

  • بررسی اجمالی ماژول Module Overview

  • سطل زنی داده های مداوم Bucketing Continuous Data

  • سطل زنی داده های مداوم با استفاده از Pandas Bucketing Continuous Data Using Pandas

  • طبقه بندی داده های مداوم با استفاده از KBinsDiscretizer Categorizing Continuous Data Using the KBinsDiscretizer

  • هش کردن Hashing

  • هش کردن ویژگی ها با واژه نامه ها ، Tuples و داده های متنی Feature Hashing with Dictionaries, Tuples, and Text Data

  • ساخت یک مدل رگرسیون ساده با استفاده از مقادیر طبقه بندی شده هاشده Building a Simple Regression Model Using Hashed Categorical Values

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش ویژگی های ساختمان از داده های اسمی
جزییات دوره
2h 39m
43
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
-
از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.