نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
این دوره به طور جامع تکنیک های پیش پردازش داده ها را تحت پوشش قرار داده و دگرگونی های موجود در یادگیری ناگهانی را فراهم می کند ، و امکان ساخت ویژگی های بسیار بهینه شده را فراهم می کند که به صورت کاملاً ریاضی مقیاس بندی شده ، عادی شده و تبدیل می شوند ... کیفیت پیش پردازش داده های عددی تحت تعیین کننده مهم نتایج مدلهای یادگیری ماشین که با استفاده از آن داده ها ساخته شده اند. با پیش پردازش داده های هوشمند و بهینه ، می توانید آموزش و اعتبارسنجی مدل را به میزان قابل توجهی تسریع کرده ، هم در وقت و هم در هزینه صرفه جویی کنید و هم عملکرد مدل را در پیش بینی بسیار بهبود بخشید. در این دوره ، Building Features from Numeric Data ، شما توانایی طراحی و اجرای خطوط لوله پیش پردازش داده های موثر و ریاضی را خواهید داشت. ابتدا اهمیت عادی سازی ، استاندارد سازی و مقیاس گذاری را خواهید فهمید ، و می توانید از شهود و مکانیک اصلاح گرایش مرکزی و همچنین پراکندگی یک ویژگی داده مطلع شوید. در مرحله بعدی ، شما نحوه شناسایی و مقابله با داده های دور از دسترس و احتمالاً غیر عادی را کشف خواهید کرد. سپس تکنیک های مهم مقیاس گذاری و عادی سازی را فرا خواهید گرفت. چنین تکنیک هایی ، به ویژه عادی سازی با استفاده از هنجار L1 ، هنجار L2 و حداکثر ، به دنبال تبدیل بردارهای ویژگی به اندازه یکنواخت هستند. چنین تکنیک هایی کاربرد گسترده ای در ساخت مدل ML دارند - به عنوان مثال در محاسبه شباهت کسینوس به وکتور سند ، و در تبدیل تصاویر قبل از اینکه تکنیک هایی مانند شبکه های عصبی کانولوشن روی آنها اعمال شود. سپس از نرمال سازی و استاندارد سازی به مقیاس گذاری و تبدیل داده ها خواهید رفت. چنین تحولاتی شامل کوانته سازی و همچنین ساخت ترانسفورماتورهای سفارشی برای موارد استفاده سفارشی است. سرانجام ، شما نحوه اجرای تحولات ورود به سیستم و قدرت را کشف خواهید کرد. شما با مقایسه نتایج سه تغییر مهم - تبدیل Yeo-Johnson ، تبدیل Box-Cox و تغییر اندازه - در تبدیل داده ها با ویژگی های غیر نرمال ، مانند داده های chi-square یا lognormal ، دوره را دور می زنید. شکل منحنی زنگ آشنا است که بسیاری از مدل ها با آن بهترین کار را دارند. وقتی این دوره را به پایان رسانید ، مهارت و دانش پیش پردازش داده و تبدیل مورد نیاز برای بهره گیری بهتر از مدلهای یادگیری ماشین خود را خواهید داشت.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
استفاده از داده های عددی در الگوریتم های یادگیری ماشین
Using Numeric Data in Machine Learning Algorithms
-
بررسی اجمالی ماژول
Module Overview
-
پیش نیازها و طرح کلی دوره
Prerequisites and Course Outline
-
مقیاس گذاری و استاندارد سازی
Scaling and Standardization
-
میانگین ، واریانس و انحراف معیار
Mean, Variance, and Standard Deviation
-
درک واریانس
Understanding Variance
-
نسخه ی نمایشی: محاسبه میانگین ، واریانس و انحراف معیار
Demo: Calculating Mean, Variance, and Standard Deviation
-
نسخه ی نمایشی: تجسم نمودار طرح و استاندارد سازی داده ها
Demo: Box Plot Visualization and Data Standardization
-
مقیاس پذیر استاندارد
Standard Scaler
-
نسخه ی نمایشی: با استفاده از تابع مقیاس داده ها را استاندارد کنید
Demo: Standardize Data Using the Scale Function
-
نسخه ی نمایشی: با استفاده از برآوردگر مقیاس استاندارد ، داده ها را استاندارد کرده و تصحیح ظروف را اعمال کنید
Demo: Standardize Data Using the Standard Scalar Estimator and Apply Bessels Correction
-
مقیاس قوی
Robust Scaler
-
نسخه ی نمایشی: مقیاس گذاری داده ها با استفاده از مقیاس کش قوی
Demo: Scaling Data Using the Robust Scaler
-
خلاصه
Summary
ویژگی های ساختمان با استفاده از عادی سازی
Building Features Using Normalization
-
بررسی اجمالی ماژول
Module Overview
-
نرمال سازی چیست؟
What Is Normalization?
-
عادی سازی و تشابه کسینوس
Normalization and Cosine Similarity
-
نسخه ی نمایشی: شباهت کسینوس و هنجار L2
Demo: Cosine Similarity and the L2 Norm
-
نسخه ی نمایشی: عادی سازی داده ها برای ساده سازی محاسبات شباهت کسینوس
Demo: Normalizing Data to Simplify Cosine Similarity Calculations
-
نسخه ی نمایشی: K به معنی خوشه بندی با تشابه کسینوس است
Demo: K-means Clustering with Cosine Similarity
-
هنجارهای L1 ، L2 و Max
L1, L2 and Max Norms
-
نسخه ی نمایشی: نرمال سازی با استفاده از هنجارهای L1 ، L2 و Max
Demo: Normalization Using L1, L2 and Max Norms
-
خلاصه
Summary
ویژگی های ساختمان با استفاده از مقیاس گذاری و تحولات
Building Features Using Scaling and Transformations
-
بررسی اجمالی ماژول
Module Overview
-
تبدیل داده های پیوسته به دسته ای
Converting Continuous Data to Categorical
-
نسخه ی نمایشی: تبدیل داده های عددی به دسته های باینری با استفاده از Binarizer
Demo: Convert Numeric Data to Binary Categories Using a Binarizer
-
نسخه ی نمایشی: استفاده از KBinsDiscretizer برای دسته بندی مقادیر عددی
Demo: Using the KBinsDiscretizer to Categorize Numeric Values
-
نسخه ی نمایشی: استفاده از مقادیر Bin برای پرچم گذاری پرتگاه ها
Demo: Using Bin Values to Flag Outliers
-
مقیاس گذاری داده ها
Scaling Data
-
نسخه ی نمایشی: مقیاس بندی با MaxAbsScaler
Demo: Scaling with the MaxAbsScaler
-
نسخه ی نمایشی: مقیاس بندی با MinMaxScaler
Demo: Scaling with the MinMaxScaler
-
تحولات سفارشی
Custom Transformations
-
نسخه ی نمایشی: انجام تغییر شکل های سفارشی با استفاده از FunctionTransformer
Demo: Performing Custom Transforms Using the FunctionTransformer
-
تولید ویژگی های چند جمله ای
Generating Polynomial Features
-
نسخه ی نمایشی: استفاده از ویژگی های چند جمله ای برای تبدیل داده ها
Demo: Using Polynomial Features to Transform Data
-
تبدیل ویژگی ها به توزیع های شبیه Gaussian با استفاده از ترانسفورماتورهای قدرت
Transforming Features to Gaussian-like Distributions Using Power Transformers
-
نسخه ی نمایشی: کار با ویژگی های ورودی توزیع شده Chi Squared
Demo: Working with Chi Squared Distributed Input Features
-
نسخه ی نمایشی: استفاده از ترانسفورماتورهای قدرت برای دریافت توزیع های عادی
Demo: Applying Power Transformers to Get Normal Distributions
-
تبدیل داده ها به توزیع های عادی یا یکنواخت با استفاده از ترانسفورماتورهای Quantile
Transforming Data to Normal or Uniform Distributions Using Quantile Transformers
-
نسخه ی نمایشی: در حال تبدیل شدن به یک توزیع عادی با استفاده از QuantileTransformer
Demo: Tranforming to a Normal Distribution Using the QuantileTransformer
-
خلاصه و مطالعه بیشتر
Summary and Further Study
نمایش نظرات