لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش یادگیری ماشین: رگرسیون
- آخرین آپدیت
دانلود Machine Learning: Regression
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
مطالعه موردی - پیشبینی قیمت مسکن
در اولین مطالعه موردی ما، پیشبینی قیمت خانه، مدلهایی ایجاد خواهید کرد که یک مقدار پیوسته (قیمت) را بر اساس ویژگیهای ورودی (متراژ، تعداد اتاق خواب و حمام و غیره) پیشبینی میکنند. این تنها یکی از موارد متعددی است که رگرسیون در آن کاربرد دارد. سایر کاربردها از پیشبینی نتایج سلامتی در پزشکی، قیمت سهام در امور مالی و مصرف انرژی در محاسبات با کارایی بالا گرفته تا تحلیل اینکه کدام رگولاتورها برای بیان ژن مهم هستند، متغیر است.
در این دوره، مدلهای رگرسیون خطی منظم شده (Regularized) را برای وظیفه پیشبینی و انتخاب ویژگی بررسی خواهید کرد. شما قادر خواهید بود مجموعههای بسیار بزرگی از ویژگیها را مدیریت کرده و بین مدلهایی با پیچیدگیهای مختلف انتخاب کنید. همچنین تأثیر جنبههای مختلف دادههای خود - مانند دادههای پرت (Outliers) - را بر مدلهای انتخابی و پیشبینیهای خود تحلیل خواهید کرد. برای برازش این مدلها، الگوریتمهای بهینهسازی را پیادهسازی میکنید که برای مجموعهدادههای بزرگ مقیاسپذیر باشند.
دستاوردهای یادگیری: در پایان این دوره، شما قادر خواهید بود:
- ورودی و خروجی یک مدل رگرسیون را شرح دهید.
- مفاهیم بایاس (Bias) و واریانس (Variance) را هنگام مدلسازی دادهها مقایسه و تحلیل کنید.
- پارامترهای مدل را با استفاده از الگوریتمهای بهینهسازی تخمین بزنید.
- پارامترها را با استفاده از اعتبارسنجی متقاطع (Cross Validation) تنظیم کنید.
- عملکرد مدل را تحلیل کنید.
- مفهوم پراکندگی (Sparsity) و نحوه دستیابی LASSO به راهکارهای پراکنده را شرح دهید.
- روشهایی را برای انتخاب بین مدلهای مختلف به کار بگیرید.
- از مدل برای ایجاد پیشبینیها بهرهبرداری کنید.
- یک مدل رگرسیون برای پیشبینی قیمتها با استفاده از مجموعهدادههای مسکن بسازید.
- این تکنیکها را در زبان پایتون پیادهسازی کنید.
سرفصل ها و درس ها
خوشآمدگویی
Welcome
خوشآمدگویی!
Welcome!
این دوره در مورد چیست؟
What is the course about?
بررسی کلی نیمه اول دوره
Outlining the first half of the course
بررسی کلی نیمه دوم دوره
Outlining the second half of the course
پیشنیازهای مورد نیاز
Assumed background
رگرسیون خطی ساده
Simple Linear Regression
مطالعه موردی در پیشبینی قیمت مسکن
A case study in predicting house prices
اصول رگرسیون: دادهها و مدل
Regression fundamentals: data & model
اصول رگرسیون: تعریف مسئله
Regression fundamentals: the task
دیاگرام بلوکی یادگیری ماشین رگرسیون
Regression ML block diagram
مدل رگرسیون خطی ساده
The simple linear regression model
هزینه استفاده از یک خط مشخص
The cost of using a given line
استفاده از خط برازش شده
Using the fitted line
تفسیر خط برازش شده
Interpreting the fitted line
تعریف هدف بهینهسازی کمترین مربعات
Defining our least squares optimization objective
یافتن نقاط ماکزیمم یا مینیمم به صورت تحلیلی
Finding maxima or minima analytically
بیشینه کردن یک تابع تکبعدی: یک مثال عملی
Maximizing a 1d function: a worked example
یافتن ماکزیمم از طریق تپهنوردی (Hill Climbing)
Finding the max via hill climbing
یافتن مینیمم از طریق تپه نزولی (Hill Descent)
Finding the min via hill descent
انتخاب اندازه گام و معیارهای همگرایی
Choosing stepsize and convergence criteria
گرادیانها: مشتقات در ابعاد متعدد
Gradients: derivatives in multiple dimensions
گرادیان نزولی: تپه نزولی چندبعدی
Gradient descent: multidimensional hill descent
محاسبه گرادیان RSS
Computing the gradient of RSS
روش اول: راه حل فرم بسته
Approach 1: closed-form solution
روش دوم: گرادیان نزولی
Approach 2: gradient descent
مقایسه روشها
Comparing the approaches
تأثیر نقاط با اهرم بالا: بررسی دادهها
Influence of high leverage points: exploring the data
تأثیر نقاط با اهرم بالا: حذف مرکز شهر
Influence of high leverage points: removing Center City
تأثیر نقاط با اهرم بالا: حذف شهرهای سطح بالا
Influence of high leverage points: removing high-end towns
توابع هزینه نامتقارن
Asymmetric cost functions
مروری کوتاه
A brief recap
رگرسیون چندگانه
Multiple Regression
مقدمهای بر رگرسیون چندگانه
Multiple regression intro
رگرسیون چندجملهای
Polynomial regression
مدلسازی فصلی (Seasonality)
Modeling seasonality
کجا فصلی بودن را مشاهده میکنیم
Where we see seasonality
رگرسیون با ویژگیهای عمومی از یک ورودی
Regression with general features of 1 input
ضرورت استفاده از ورودیهای متعدد
Motivating the use of multiple inputs
تعریف نمادگذاریها
Defining notation
رگرسیون با ویژگیهای ورودیهای متعدد
Regression with features of multiple inputs
تفسیر برازش رگرسیون چندگانه
Interpreting the multiple regression fit
بازنویسی مدل تک مشاهدهای به صورت نماد برداری
Rewriting the single observation model in vector notation
بازنویسی مدل برای تمام مشاهدات به صورت نماد ماتریسی
Rewriting the model for all observations in matrix notation
محاسبه هزینه یک منحنی D بعدی
Computing the cost of a D-dimensional curve
محاسبه گرادیان RSS
Computing the gradient of RSS
روش اول: راه حل فرم بسته
Approach 1: closed-form solution
بحث در مورد راه حل فرم بسته
Discussing the closed-form solution
روش دوم: گرادیان نزولی
Approach 2: gradient descent
بهروزرسانی ویژگی به ویژگی
Feature-by-feature update
خلاصه الگوریتمی روش گرادیان نزولی
Algorithmic summary of gradient descent approach
مروری کوتاه
A brief recap
ارزیابی عملکرد
Assessing Performance
مقدمهای بر ارزیابی عملکرد
Assessing performance intro
منظور ما از «زیان» (Loss) چیست؟
What do we mean by "loss"?
خطای آموزش: ارزیابی زیان روی مجموعه آموزش
Training error: assessing loss on the training set
خطای تعمیم: آنچه واقعاً میخواهیم
Generalization error: what we really want
خطای تست: آنچه در واقعیت میتوانیم محاسبه کنیم
Test error: what we can actually compute
نمایش نظرات