لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش یادگیری ماشین کاربردی: مهندسی ویژگی
Applied Machine Learning: Feature Engineering
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
کیفیت پیش بینی های ارائه شده از مدل یادگیری ماشین شما ، بازتابی مستقیم از داده هایی است که در حین آموزش به آنها می دهید. مهندسی ویژگی به شما کمک می کند تا آخرین بیت ارزش را از داده ها استخراج کنید. این دوره ابزارهایی را برای به دست آوردن یک مجموعه داده ، تحریک سیگنال و پرتاب صدا برای بهینه سازی مدل های شما فراهم می کند. مفاهیم تقریباً به هر نوع الگوریتم یادگیری ماشین تعمیم می یابند. مربی درک جدامسکی اطلاعات تازه ای در زمینه یادگیری ماشین و مقدمه ای كامل در زمینه مهندسی ویژگی ها ارائه می دهد. او ویژگی های مداوم و طبقه بندی شده را کاوش می کند و نحوه تمیز کردن ، عادی سازی و تغییر آنها را نشان می دهد. بیاموزید که چگونه مقادیر از دست رفته را حذف کنید ، موارد پرت را حذف کنید ، داده ها را تغییر دهید ، شاخص ها را ایجاد کنید و ویژگی ها را تبدیل کنید. در فصل های آخر ، درک نحوه تهیه ویژگی ها برای مدل سازی را توضیح می دهد و چهار تغییر برای مقایسه ارائه می دهد ، بنابراین می توانید تأثیر تمیز کردن ، تبدیل و ایجاد ویژگی ها را از طریق عملکرد عملکرد مدل ارزیابی کنید.
موضوعات شامل:
مهندسی ویژگی چیست؟ li>
کاوش داده ها li>
ویژگی های طراحی li>
تمیز کردن ویژگی های موجود li>
ایجاد ویژگی های جدید li>
استاندارد سازی ویژگی ها li>
مقایسه تأثیرات بر عملکرد مدل li>
سرفصل ها و درس ها
مقدمه
Introduction
راز یادگیری موثر ماشین
The secret of effective machine learning
آنچه شما باید بدانید
What you should know
به چه ابزاری نیاز دارید
What tools you need
با استفاده از پرونده های تمرینی
Using the exercise files
1. مبانی یادگیری ماشین را مرور کنید
1. Review Machine Learning Basics
یادگیری ماشینی چیست؟
What is machine learning?
یادگیری ماشینی در زندگی واقعی چگونه است؟
What does machine learning look like in real life?
خط لوله یادگیری ماشین پایان به پایان به چه صورت است؟
What does an end-to-end machine learning pipeline look like?
2. مقدمه ای بر مهندسی ویژگی
2. Introduction to Feature Engineering
مهندسی ویژگی چیست؟
What is feature engineering?
چرا مهندسی ویژگی مهم است؟
Why does feature engineering matter?
ابزارهای جعبه ابزار مهندسی ویژگی چیست؟
What are the tools in the feature engineering toolbox?
3. داده ها را کاوش کنید
3. Explore the Data
از چه داده ای استفاده می کنید؟
What data are you using?
ویژگی های مداوم را کاوش کنید
Explore continuous features
ویژگی های مداوم را ترسیم کنید
Plot continuous features
ویژگی های طبقه بندی شده را کاوش کنید
Explore categorical features
طرح ویژگی های طبقه بندی شده
Plot categorical features
خلاصه ویژگی ها
Summary of features
4. ایجاد و تمیز کردن ویژگی ها
4. Creating and Cleaning Features
مقادیر از دست رفته در داده ها را درمان کنید
Treat missing values in the data
داده های درپوش و کف برای حذف پرتگاه ها
Cap and floor data to remove outliers
ویژگی های کج تغییر شکل دهید
Transform skewed features
ایجاد ویژگی های جدید از متن
Creating new features from text
شاخص ایجاد کنید
Create indicators
ترکیب ویژگی های موجود در یک ویژگی جدید
Combining existing features into a new feature
ویژگی های دسته ای را به عددی تبدیل کنید
Convert categorical features to numeric
5. ویژگی ها را برای مدل سازی آماده کنید
5. Prepare Features for Modeling
مجموعه های آموزشی و آزمایشی ایجاد کنید
Create training and test sets
همه ویژگی ها را استاندارد کنید
Standardize all features
سه مجموعه داده نهایی را بنویسید
Write out three final datasets
6. همه ویژگی ها را مقایسه کنید
6. Compare All Features
اصول ارزیابی مدل را مرور کنید
Review model evaluation basics
مدلی با ویژگی های اصلی خام بسازید
Build a model with raw original features
مدلی با ویژگی های اصلی تمیز شده بسازید
Build a model with cleaned original features
یک مدل با تمام ویژگی ها بسازید
Build a model with all features
مدلی با مجموعه ای از ویژگی ها کاهش دهید
Build a model with reduced set of features
همه تغییرات مدل را مقایسه و ارزیابی کنید
Compare and evaluate all model variations
نتیجه
Conclusion
چگونه به پیشرفت مهارت های خود ادامه دهیم
How to continue advancing your skills
derek jedamski یک دانشمند داده ماهر است که متخصص در یادگیری ماشین است.
Derek دارای تجربه با مدلسازی رگرسیون و طبقه بندی، پردازش زبان طبیعی، تجزیه و تحلیل آماری، کنترل کیفیت، تجزیه و تحلیل کسب و کار، و برقراری ارتباط نتایج فنی به مخاطبان است زمینه های مختلف او همچنین دارای درک کامل از پایتون، R، SQL، Apache Spark و سایر چارچوب های محاسباتی و زبان ها است. در حال حاضر، Derek در Github به عنوان یک دانشمند داده کار می کند.
نمایش نظرات