این یک دوره آموزشی عملی و مبتنی بر پروژه است که برای کمک به شما در تسلط بر مبانی مدلسازی طبقهبندی در پایتون طراحی شده است.
ما با مرور گردش کار علم داده، بحث در مورد اهداف اولیه انواع الگوریتمهای طبقهبندی، و بررسی عمیق مراحل مدلسازی طبقهبندی که در طول دوره از آنها استفاده خواهیم کرد، شروع میکنیم.
میآموزید که تجزیه و تحلیل دادههای اکتشافی را انجام دهید، از تکنیکهای مهندسی ویژگیها مانند مقیاسبندی، متغیرهای ساختگی و binning استفاده کنید، و دادهها را با تقسیم آن به مجموعه دادههای قطار، آزمایش و اعتبارسنجی برای مدلسازی آماده کنید.
از آنجا، مدلهای رگرسیون لجستیکی K-Nearest Neighbors را متناسب میکنیم و شهودی برای تفسیر ضرایب آنها و ارزیابی عملکرد آنها با استفاده از ابزارهایی مانند ماتریسهای سردرگمی و معیارهایی مانند دقت، دقت، و یادآوری ایجاد میکنیم. همچنین تکنیکهایی را برای مدلسازی دادههای نامتعادل، از جمله تنظیم آستانه، روشهای نمونهبرداری مانند نمونهبرداری بیش از حد SMOTE، و تنظیم وزن کلاس در تابع هزینه مدل پوشش خواهیم داد.
در طول دوره، شما نقش دانشمند داده را برای بخش مدیریت ریسک در بانک ملی Maven بازی خواهید کرد. با استفاده از مهارتهایی که در طول دوره یاد میگیرید، از Python برای کاوش دادههای آنها و ساخت مدلهای طبقهبندی استفاده میکنید تا بهطور دقیق مشخص کنید که کدام مشتریان بر اساس پروفایلهایشان دارای ریسک اعتباری بالا، متوسط و پایین هستند.
در آخر، شما یاد خواهید گرفت که مدل های درخت تصمیم را برای طبقه بندی بسازید و ارزیابی کنید. این مدلها را با استفاده از پایتون تطبیق، تجسم و تنظیم دقیق میکنید، سپس دانش خود را در مدلهای مجموعه پیشرفتهتر مانند جنگلهای تصادفی و ماشینهای تقویتشده گرادیان اعمال میکنید.
خلاصه دوره:
مقدمه ای بر علم داده
زمینه های علم داده و یادگیری ماشین را معرفی کنید، مهارت های ضروری را مرور کنید، و هر مرحله از گردش کار علم داده را معرفی کنید
طبقه بندی 101
اصول طبقهبندی را مرور کنید، از جمله اصطلاحات کلیدی، انواع و اهداف مدلسازی طبقهبندی، و گردش کار مدلسازی
Pre-Modeling Data Prep EDA
مروری بر مراحل آماده سازی داده های EDA لازم برای انجام مدل سازی، از جمله تکنیک های کلیدی برای کشف هدف، ویژگی ها و روابط آنها
K-نزدیکترین همسایه ها
بیاموزید که چگونه الگوریتم k-نزدیکترین همسایه (KNN) نقاط داده را طبقه بندی می کند و ساختن مدل های KNN را در پایتون تمرین کنید
رگرسیون لجستیک
رگرسیون لجستیک را معرفی کنید، ریاضیات پشت مدل را بیاموزید و برازش آنها و تنظیم قدرت منظم سازی را تمرین کنید
معیارهای طبقه بندی
یاد بگیرید چگونه و چه زمانی از چندین معیار مهم برای ارزیابی مدلهای طبقهبندی استفاده کنید، مانند دقت، یادآوری، امتیاز F1 و ROC-AUC
داده های نامتعادل
چالشهای مدلسازی دادههای نامتعادل را درک کنید و استراتژیهایی را برای بهبود عملکرد مدل در این سناریوها بیاموزید
درختان تصمیم
مدلهای درخت تصمیم را بسازید و ارزیابی کنید، الگوریتمهایی که به دنبال شکافهایی در دادههای شما هستند که کلاسهای شما را به بهترین شکل از هم جدا میکنند
مدل های گروه
با اصول اولیه مدلهای گروهی آشنا شوید، سپس به مدلهای خاصی مانند جنگلهای تصادفی و ماشینهای تقویتشده گرادیان بپردازید
__________
آماده شیرجه رفتن هستید؟ امروز بپیوندید و به موارد زیر دسترسی فوری و مادام العمر داشته باشید:
9.5 ساعت ویدیو با کیفیت بالا
18 تکلیف
9 آزمون
2 پروژه
علم داده در پایتون: کتاب الکترونیکی طبقه بندی (250+ صفحه)
راه حل فایل های پروژه قابل دانلود
پشتیبانی تخصصی و انجمن پرسش و پاسخ
30 روز ضمانت رضایت Udemy
اگر دانشمند داده مشتاقی هستید که به دنبال معرفی دنیای مدلسازی طبقهبندی با پایتون هستید، این دوره برای شما مناسب است.
یادگیری مبارک!
-Chris Bruehl (مدرس ارشد پایتون، متخصص علوم داده، Maven Analytics)
برنده جایزه تجزیه و تحلیل و آموزش هوش تجاری
Chris Bruehlمربی اصلی پایتون در Maven Analytics
نمایش نظرات