این یک دوره آموزشی عملی و مبتنی بر پروژه است که برای کمک به شما در تسلط بر اصول یادگیری بدون نظارت در پایتون طراحی شده است.
ما با مرور گردش کار علم داده، بحث در مورد کاربرد تکنیکهای یادگیری بدون نظارت، و طی مراحل آمادهسازی داده مورد نیاز برای مدلسازی شروع میکنیم. شما یاد خواهید گرفت که چگونه دانه بندی ردیف صحیح را برای مدل سازی تنظیم کنید، تکنیک های مهندسی ویژگی را اعمال کنید، ویژگی های مربوطه را انتخاب کنید، و داده های خود را با استفاده از عادی سازی و استانداردسازی مقیاس بندی کنید.
از آنجا ما 3 مدل خوشهبندی محبوب را با استفاده از scikit-learn تنظیم، تنظیم و تفسیر میکنیم. ما با K-Means Clustering شروع می کنیم، یاد می گیریم که مراکز خوشه خروجی را تفسیر کنیم، و از نمودارهای اینرسی برای انتخاب تعداد مناسب خوشه ها استفاده می کنیم. در مرحله بعد، خوشهبندی سلسله مراتبی را پوشش میدهیم، جایی که از دندروگرام برای شناسایی خوشهها و نقشههای خوشهای برای تفسیر آنها استفاده میکنیم. در نهایت، از DBSCAN برای شناسایی خوشهها و نقاط نویز و ارزیابی مدلها با استفاده از امتیاز شبح آنها استفاده میکنیم.
ما همچنین از DBSCAN و جنگلهای جداسازی برای تشخیص ناهنجاری استفاده میکنیم، یک کاربرد رایج از مدلهای یادگیری بدون نظارت برای شناسایی الگوهای پرت و غیرعادی. شما یاد خواهید گرفت که نتایج هر مدل را تنظیم و تفسیر کنید و ناهنجاری ها را با استفاده از نمودارهای زوجی تجسم کنید.
در ادامه، مفهوم کاهش ابعاد را معرفی میکنیم، مزایای آن برای علم داده را مورد بحث قرار میدهیم، و مراحلی را در گردش کار علم داده که میتواند در آن اعمال شود، بررسی میکنیم. سپس دو تکنیک رایج را پوشش خواهیم داد: تجزیه و تحلیل مؤلفه اصلی، که برای استخراج ویژگی و تجسم داده عالی است، و t-SNE، که برای تجسم داده ایده آل است.
در آخر، موتورهای توصیه را معرفی میکنیم، و شما با استفاده از تکنیکهایی مانند تشابه کسینوس و تجزیه ارزش منفرد، ایجاد توصیهکنندههای فیلتر مبتنی بر محتوا و مشارکتی را تمرین خواهید کرد.
در طول دوره شما نقش یک دانشمند داده را برای تیم تحلیل منابع انسانی در یک شرکت نرم افزاری ایفا خواهید کرد که تلاش می کند حفظ کارمندان را افزایش دهد. با استفاده از مهارتهایی که در طول دوره یاد میگیرید، از پایتون برای تقسیمبندی کارمندان، تجسم خوشهها و توصیه گامهای بعدی برای افزایش حفظ استفاده خواهید کرد.
خلاصه دوره:
مقدمه ای بر علم داده
زمینه های علم داده و یادگیری ماشین را معرفی کنید، مهارت های ضروری را مرور کنید و هر مرحله از گردش کار علم داده را معرفی کنید
یادگیری بدون نظارت 101
اصول یادگیری بدون نظارت را مرور کنید، از جمله مفاهیم کلیدی، انواع تکنیک ها و کاربردها، و جایگاه آن در گردش کار علم داده
آماده سازی داده های پیش مدل سازی
مراحل آمادهسازی دادههای مورد نیاز برای اعمال مدلهای یادگیری بدون نظارت، از جمله بازسازی دادهها، ویژگیهای مقیاسبندی مهندسی، و موارد دیگر را دوباره جمعبندی کنید
خوشه بندی
از سه تکنیک مختلف خوشه بندی در پایتون استفاده کنید و یاد بگیرید که نتایج آنها را با استفاده از معیارها، تجسم ها و تخصص دامنه تفسیر کنید
تشخیص ناهنجاری
بدانید تشخیص ناهنجاری در جریان کار علم داده کجا قرار میگیرد و تکنیکهایی مانند جنگلهای جداسازی و DBSCAN را در پایتون بکار ببرید
کاهش ابعاد
از تکنیک هایی مانند تجزیه و تحلیل مؤلفه اصلی (PCA) و t-SNE در پایتون برای کاهش تعداد ویژگی های مجموعه داده بدون از دست دادن اطلاعات استفاده کنید
توصیهکنندگان
انواع رویکردها برای ایجاد توصیهکننده را بشناسید، سپس تکنیکهای یادگیری بدون نظارت را در پایتون اعمال کنید، از جمله تشابه کسینوس و تجزیه بردار منفرد (SVD)
__________
آماده شیرجه رفتن هستید؟ امروز بپیوندید و به موارد زیر دسترسی فوری و مادام العمر داشته باشید:
16.5 ساعت ویدئو با کیفیت بالا
22 تکلیف
7 آزمون
3 پروژه
علم داده در پایتون: کتاب الکترونیکی آموزش بدون نظارت (بیش از 350 صفحه)
راه حل فایل های پروژه قابل دانلود
پشتیبانی تخصصی و انجمن پرسش و پاسخ
30 روز ضمانت رضایت Udemy
اگر شما یک دانشمند داده مشتاق یا کارکشته هستید که به دنبال یک نمای کلی از تکنیک های یادگیری بدون نظارت در پایتون با تمرکز بر تفسیر هستید، این دوره برای شما مناسب است.
یادگیری مبارک!
-آلیس ژائو (مدرس علوم داده متخصص پایتون، Maven Analytics)
برنده جایزه تجزیه و تحلیل و آموزش هوش تجاری
Alice Zhaoمدرس علم داده در Maven Analytics
نمایش نظرات