آموزش علم داده در پایتون: یادگیری بدون نظارت

Data Science in Python: Unsupervised Learning

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: Python را برای یادگیری ماشینی علوم داده بیاموزید و با پروژه های سرگرم کننده و کاربردی، مدل های یادگیری بدون نظارت بسازید! بر پایه‌های یادگیری ماشینی بدون نظارت در پایتون، از جمله خوشه‌بندی، تشخیص ناهنجاری، کاهش ابعاد، و توصیه‌کننده‌ها تسلط داشته باشید. داده‌ها را برای مدل‌سازی با استفاده از مهندسی ویژگی، انتخاب و مقیاس‌بندی آماده کنید، تناسب، تنظیم و تفسیر سه نوع الگوریتم خوشه‌بندی: K-Means Clustering ، خوشه بندی سلسله مراتبی و DBSCAN از تکنیک های یادگیری بدون نظارت مانند جنگل های جداسازی و DBSCAN برای تشخیص ناهنجاری استفاده کنید و دو نوع مدل کاهش ابعاد را اعمال و تفسیر کنید: تجزیه و تحلیل مؤلفه اصلی (PCA) و t-SNE ساخت موتورهای توصیه با استفاده از تکنیک های فیلتر مبتنی بر محتوا و مشارکتی. از جمله تشابه کسینوس و تجزیه ارزش تکین (SVD) پیش نیازها: اکیداً توصیه می‌کنیم دوره آموزشی Data Prep & EDA را قبل از این یکی از نوت‌بوک‌های Jupyter (دانلود رایگان، مراحل نصب را طی می‌کنیم) بخوانید. آشنایی با پایتون و پانداهای پایه توصیه می‌شود، اما لازم نیست

این یک دوره آموزشی عملی و مبتنی بر پروژه است که برای کمک به شما در تسلط بر اصول یادگیری بدون نظارت در پایتون طراحی شده است.


ما با مرور گردش کار علم داده، بحث در مورد کاربرد تکنیک‌های یادگیری بدون نظارت، و طی مراحل آماده‌سازی داده مورد نیاز برای مدل‌سازی شروع می‌کنیم. شما یاد خواهید گرفت که چگونه دانه بندی ردیف صحیح را برای مدل سازی تنظیم کنید، تکنیک های مهندسی ویژگی را اعمال کنید، ویژگی های مربوطه را انتخاب کنید، و داده های خود را با استفاده از عادی سازی و استانداردسازی مقیاس بندی کنید.


از آنجا ما 3 مدل خوشه‌بندی محبوب را با استفاده از scikit-learn تنظیم، تنظیم و تفسیر می‌کنیم. ما با K-Means Clustering شروع می کنیم، یاد می گیریم که مراکز خوشه خروجی را تفسیر کنیم، و از نمودارهای اینرسی برای انتخاب تعداد مناسب خوشه ها استفاده می کنیم. در مرحله بعد، خوشه‌بندی سلسله مراتبی را پوشش می‌دهیم، جایی که از دندروگرام برای شناسایی خوشه‌ها و نقشه‌های خوشه‌ای برای تفسیر آنها استفاده می‌کنیم. در نهایت، از DBSCAN برای شناسایی خوشه‌ها و نقاط نویز و ارزیابی مدل‌ها با استفاده از امتیاز شبح آنها استفاده می‌کنیم.


ما همچنین از DBSCAN و جنگل‌های جداسازی برای تشخیص ناهنجاری استفاده می‌کنیم، یک کاربرد رایج از مدل‌های یادگیری بدون نظارت برای شناسایی الگوهای پرت و غیرعادی. شما یاد خواهید گرفت که نتایج هر مدل را تنظیم و تفسیر کنید و ناهنجاری ها را با استفاده از نمودارهای زوجی تجسم کنید.


در ادامه، مفهوم کاهش ابعاد را معرفی می‌کنیم، مزایای آن برای علم داده را مورد بحث قرار می‌دهیم، و مراحلی را در گردش کار علم داده که می‌تواند در آن اعمال شود، بررسی می‌کنیم. سپس دو تکنیک رایج را پوشش خواهیم داد: تجزیه و تحلیل مؤلفه اصلی، که برای استخراج ویژگی و تجسم داده عالی است، و t-SNE، که برای تجسم داده ایده آل است.


در آخر، موتورهای توصیه را معرفی می‌کنیم، و شما با استفاده از تکنیک‌هایی مانند تشابه کسینوس و تجزیه ارزش منفرد، ایجاد توصیه‌کننده‌های فیلتر مبتنی بر محتوا و مشارکتی را تمرین خواهید کرد.


در طول دوره شما نقش یک دانشمند داده را برای تیم تحلیل منابع انسانی در یک شرکت نرم افزاری ایفا خواهید کرد که تلاش می کند حفظ کارمندان را افزایش دهد. با استفاده از مهارت‌هایی که در طول دوره یاد می‌گیرید، از پایتون برای تقسیم‌بندی کارمندان، تجسم خوشه‌ها و توصیه گام‌های بعدی برای افزایش حفظ استفاده خواهید کرد.


خلاصه دوره:


  • مقدمه ای بر علم داده

    • زمینه های علم داده و یادگیری ماشین را معرفی کنید، مهارت های ضروری را مرور کنید و هر مرحله از گردش کار علم داده را معرفی کنید


  • یادگیری بدون نظارت 101

    • اصول یادگیری بدون نظارت را مرور کنید، از جمله مفاهیم کلیدی، انواع تکنیک ها و کاربردها، و جایگاه آن در گردش کار علم داده


  • آماده سازی داده های پیش مدل سازی

    • مراحل آماده‌سازی داده‌های مورد نیاز برای اعمال مدل‌های یادگیری بدون نظارت، از جمله بازسازی داده‌ها، ویژگی‌های مقیاس‌بندی مهندسی، و موارد دیگر را دوباره جمع‌بندی کنید


  • خوشه بندی

    • از سه تکنیک مختلف خوشه بندی در پایتون استفاده کنید و یاد بگیرید که نتایج آنها را با استفاده از معیارها، تجسم ها و تخصص دامنه تفسیر کنید


  • تشخیص ناهنجاری

    • بدانید تشخیص ناهنجاری در جریان کار علم داده کجا قرار می‌گیرد و تکنیک‌هایی مانند جنگل‌های جداسازی و DBSCAN را در پایتون بکار ببرید


  • کاهش ابعاد

    • از تکنیک هایی مانند تجزیه و تحلیل مؤلفه اصلی (PCA) و t-SNE در پایتون برای کاهش تعداد ویژگی های مجموعه داده بدون از دست دادن اطلاعات استفاده کنید


  • توصیه‌کنندگان

    • انواع رویکردها برای ایجاد توصیه‌کننده را بشناسید، سپس تکنیک‌های یادگیری بدون نظارت را در پایتون اعمال کنید، از جمله تشابه کسینوس و تجزیه بردار منفرد (SVD)


__________


آماده شیرجه رفتن هستید؟ امروز بپیوندید و به موارد زیر دسترسی فوری و مادام العمر داشته باشید:


  • 16.5 ساعت ویدئو با کیفیت بالا

  • 22 تکلیف

  • 7 آزمون

  • 3 پروژه

  • علم داده در پایتون: کتاب الکترونیکی آموزش بدون نظارت (بیش از 350 صفحه)

  • راه حل فایل های پروژه قابل دانلود

  • پشتیبانی تخصصی و انجمن پرسش و پاسخ

  • 30 روز ضمانت رضایت Udemy


اگر شما یک دانشمند داده مشتاق یا کارکشته هستید که به دنبال یک نمای کلی از تکنیک های یادگیری بدون نظارت در پایتون با تمرکز بر تفسیر هستید، این دوره برای شما مناسب است.


یادگیری مبارک!

-آلیس ژائو (مدرس علوم داده متخصص پایتون، Maven Analytics)


سرفصل ها و درس ها

شروع شدن Getting Started

  • معرفی دوره Course Introduction

  • درباره این سریال About This Series

  • ساختار و رئوس مطالب دوره Course Structure & Outline

  • مرا بخوانید: نکات مهم برای دانشجویان جدیدالورود READ ME: Important Notes for New Students

  • دانلود: منابع دوره DOWNLOAD: Course Resources

  • معرفی پروژه دوره Introducing the Course Project

  • تعیین انتظارات Setting Expectations

  • نصب و راه اندازی Jupyter Jupyter Installation & Launch

مقدمه ای بر علم داده Intro to Data Science

  • بخش مقدمه Section Introduction

  • علم داده چیست؟ What is Data Science?

  • مجموعه مهارت های علم داده Data Science Skill Set

  • یادگیری ماشینی چیست؟ What is Machine Learning?

  • الگوریتم های رایج یادگیری ماشین Common Machine Learning Algorithms

  • گردش کار علم داده Data Science Workflow

  • مرحله 1: تعیین محدوده یک پروژه Step 1: Scoping a Project

  • مرحله 2: جمع آوری داده ها Step 2: Gathering Data

  • مرحله 3: پاک کردن داده ها Step 3: Cleaning Data

  • مرحله 4: کاوش داده ها Step 4: Exploring Data

  • مرحله 5: مدل سازی داده ها Step 5: Modeling Data

  • مرحله 6: اشتراک گذاری بینش Step 6: Sharing Insights

  • یادگیری بدون نظارت Unsupervised Learning

  • خوراکی های کلیدی Key Takeaways

  • مقدمه ای بر علم داده Intro to Data Science

یادگیری بدون نظارت 101 Unsupervised Learning 101

  • بخش مقدمه Section Introduction

  • یادگیری بدون نظارت 101 Unsupervised Learning 101

  • تکنیک های یادگیری بدون نظارت Unsupervised Learning Techniques

  • برنامه های آموزشی بدون نظارت Unsupervised Learning Applications

  • ساختار این دوره Structure of This Course

  • گردش کار یادگیری بدون نظارت Unsupervised Learning Workflow

  • خوراکی های کلیدی Key Takeaways

  • یادگیری بدون نظارت 101 Unsupervised Learning 101

Pre-Modeling Data Prep Pre-Modeling Data Prep

  • بخش مقدمه Section Introduction

  • آماده سازی داده برای یادگیری بدون نظارت Data Prep for Unsupervised Learning

  • تنظیم دانه بندی صحیح ردیف Setting the Correct Row Granularity

  • دمو: گروه بر اساس DEMO: Group By

  • دمو: محور DEMO: Pivot

  • ASSIGNMENT: تنظیم صحیح دانه بندی ردیف ASSIGNMENT: Setting the Correct Row Granularity

  • راه حل: تنظیم دانه بندی ردیف صحیح SOLUTION: Setting the Correct Row Granularity

  • آماده سازی ستون ها برای مدل سازی Preparing Columns for Modeling

  • شناسایی داده های از دست رفته Identifying Missing Data

  • رسیدگی به داده های از دست رفته Handling Missing Data

  • تبدیل به عددی Converting to Numeric

  • تبدیل به DateTime Converting to DateTime

  • استخراج تاریخ Extracting DateTime

  • محاسبه بر اساس یک شرط Calculating Based on a Condition

  • متغیرهای ساختگی Dummy Variables

  • تکلیف: آماده سازی ستون ها برای مدل سازی ASSIGNMENT: Preparing Columns for Modeling

  • راه حل: آماده سازی ستون ها برای مدل سازی SOLUTION: Preparing Columns for Modeling

  • مهندسی ویژگی Feature Engineering

  • مهندسی ویژگی در طول آماده سازی داده ها Feature Engineering During Data Prep

  • اعمال محاسبات Applying Calculations

  • ارزش های باینینگ Binning Values

  • شناسایی متغیرهای پروکسی Identifying Proxy Variables

  • نکات مهندسی ویژگی Feature Engineering Tips

  • تکلیف: مهندسی ویژگی ASSIGNMENT: Feature Engineering

  • راه حل: مهندسی ویژگی SOLUTION: Feature Engineering

  • حذف شناسه ها از مدل سازی Excluding Identifiers From Modeling

  • انتخاب ویژگی Feature Selection

  • تکلیف: انتخاب ویژگی ASSIGNMENT: Feature Selection

  • راه حل: انتخاب ویژگی SOLUTION: Feature Selection

  • مقیاس بندی ویژگی ها Feature Scaling

  • عادی سازی Normalization

  • استاندارد سازی Standardization

  • تکلیف: مقیاس بندی ویژگی ASSIGNMENT: Feature Scaling

  • راه حل: مقیاس بندی ویژگی SOLUTION: Feature Scaling

  • خوراکی های کلیدی Key Takeaways

  • Pre-Modeling Data Prep Pre-Modeling Data Prep

خوشه بندی Clustering

  • بخش مقدمه Section Introduction

  • مبانی خوشه بندی Clustering Basics

  • K-Means Clustering K-Means Clustering

  • K-Means Clustering در پایتون K-Means Clustering in Python

  • DEMO: K-Means Clustering در پایتون DEMO: K-Means Clustering in Python

  • تجسم K-Means Clustering Visualizing K-Means Clustering

  • تفسیر K-Means Clustering Interpreting K-Means Clustering

  • تجسم مراکز خوشه ای Visualizing Cluster Centers

  • تکلیف: K-Means Clustering ASSIGNMENT: K-Means Clustering

  • راه حل: K-Means Clustering SOLUTION: K-Means Clustering

  • اینرسی Inertia

  • ترسیم اینرسی در پایتون Plotting Inertia in Python

  • DEMO: رسم اینرسی در پایتون DEMO: Plotting Inertia in Python

  • تکلیف: طرح اینرسی ASSIGNMENT: Inertia Plot

  • راه حل: طرح اینرسی SOLUTION: Inertia Plot

  • تنظیم یک مدل K-Means Tuning a K-Means Model

  • دمو: تنظیم یک مدل K-Means DEMO: Tuning a K-Means Model

  • تکلیف: تنظیم یک مدل K-Means ASSIGNMENT: Tuning a K-Means Model

  • راه حل: تنظیم یک مدل K-Means SOLUTION: Tuning a K-Means Model

  • انتخاب بهترین مدل Selecting the Best Model

  • DEMO: انتخاب بهترین مدل DEMO: Selecting the Best Model

  • تکلیف: انتخاب بهترین مدل K-Means ASSIGNMENT: Selecting the Best K-Means Model

  • راه حل: انتخاب بهترین مدل K-Means SOLUTION: Selecting the Best K-Means Model

  • خوشه بندی سلسله مراتبی Hierarchical Clustering

  • دندروگرام ها در پایتون Dendrograms in Python

  • خوشه بندی تجمعی در پایتون Agglomerative Clustering in Python

  • DEMO: خوشه بندی تجمعی در پایتون DEMO: Agglomerative Clustering in Python

  • نقشه های خوشه ای در پایتون Cluster Maps in Python

  • دمو: نقشه های خوشه ای در پایتون DEMO: Cluster Maps in Python

  • تکلیف: خوشه بندی سلسله مراتبی ASSIGNMENT: Hierarchical Clustering

  • راه حل: خوشه بندی سلسله مراتبی SOLUTION: Hierarchical Clustering

  • DBSCAN DBSCAN

  • DBSCAN در پایتون DBSCAN in Python

  • امتیاز سیلوئت Silhouette Score

  • امتیاز Silhouette در پایتون Silhouette Score in Python

  • نسخه آزمایشی: DBSCAN و امتیاز Silhouette در پایتون DEMO: DBSCAN and Silhouette Score in Python

  • تکلیف: DBSCAN ASSIGNMENT: DBSCAN

  • راه حل: DBSCAN SOLUTION: DBSCAN

  • مقایسه الگوریتم های خوشه بندی Comparing Clustering Algorithms

  • خوشه بندی مراحل بعدی Clustering Next Steps

  • DEMO: مدل های خوشه بندی را مقایسه کنید DEMO: Compare Clustering Models

  • DEMO: برچسب داده های دیده نشده DEMO: Label Unseen Data

  • خوراکی های کلیدی Key Takeaways

  • خوشه بندی Clustering

پروژه: خوشه بندی مشتریان PROJECT: Clustering Clients

  • بررسی اجمالی پروژه Project Overview

  • راه حل: آماده سازی داده ها SOLUTION: Data Prep

  • راه حل: K-Means Clustering SOLUTION: K-Means Clustering

  • راه حل: خوشه بندی سلسله مراتبی SOLUTION: Hierarchical Clustering

  • راه حل: DBSCAN SOLUTION: DBSCAN

  • راه حل: مقایسه، توصیه و پیش بینی SOLUTION: Compare, Recommend and Predict

تشخیص ناهنجاری Anomaly Detection

  • بخش مقدمه Section Introduction

  • مبانی تشخیص ناهنجاری Anomaly Detection Basics

  • رویکردهای تشخیص ناهنجاری Anomaly Detection Approaches

  • گردش کار تشخیص ناهنجاری Anomaly Detection Workflow

  • جنگل های ایزوله Isolation Forests

  • جنگل های ایزوله در پایتون Isolation Forests in Python

  • تجسم ناهنجاری ها Visualizing Anomalies

  • تنظیم و تفسیر جنگل های ایزوله Tuning and Interpreting Isolation Forests

  • تکلیف: جنگل های ایزوله ASSIGNMENT: Isolation Forests

  • راه حل: جنگل های ایزوله SOLUTION: Isolation Forests

  • DBSCAN برای تشخیص ناهنجاری DBSCAN for Anomaly Detection

  • DBSCAN برای تشخیص ناهنجاری در پایتون DBSCAN for Anomaly Detection in Python

  • تجسم ناهنجاری های DBSCAN Visualizing DBSCAN Anomalies

  • تکلیف: DBSCAN برای تشخیص ناهنجاری ASSIGNMENT: DBSCAN for Anomaly Detection

  • راه حل: DBSCAN برای تشخیص ناهنجاری SOLUTION: DBSCAN for Anomaly Detection

  • مقایسه الگوریتم های تشخیص ناهنجاری Comparing Anomaly Detection Algorithms

  • RECAP: خوشه بندی و تشخیص ناهنجاری RECAP: Clustering and Anomaly Detection

  • خوراکی های کلیدی Key Takeaways

  • تشخیص ناهنجاری Anomaly Detection

کاهش ابعاد Dimensionality Reduction

  • بخش مقدمه Section Introduction

  • مبانی کاهش ابعاد Dimensionality Reduction Basics

  • چرا ابعاد را کاهش دهیم؟ Why Reduce Dimensions?

  • گردش کار کاهش ابعاد Dimensionality Reduction Workflow

  • تجزیه و تحلیل مؤلفه های اصلی Principal Component Analysis

  • تجزیه و تحلیل اجزای اصلی در پایتون Principal Component Analysis in Python

  • نسبت واریانس توضیح داده شده Explained Variance Ratio

  • DEMO: PCA و نسبت واریانس توضیح داده شده در پایتون DEMO: PCA and Explained Variance Ratio in Python

  • تکلیف: تجزیه و تحلیل مؤلفه اصلی ASSIGNMENT: Principal Component Analysis

  • راه حل: تجزیه و تحلیل اجزای اصلی SOLUTION: Principal Component Analysis

  • تفسیر PCA Interpreting PCA

  • DEMO: تفسیر PCA DEMO: Interpreting PCA

  • تکلیف: تفسیر PCA ASSIGNMENT: Interpreting PCA

  • راه حل: تفسیر PCA SOLUTION: Interpreting PCA

  • انتخاب ویژگی در مقابل استخراج ویژگی Feature Selection vs Feature Extraction

  • مراحل بعدی PCA PCA Next Steps

  • T-SNE T-SNE

  • T-SNE در پایتون T-SNE in Python

  • تکلیف: T-SNE ASSIGNMENT: T-SNE

  • راه حل: T-SNE SOLUTION: T-SNE

  • PCA در مقابل t-SNE PCA vs t-SNE

  • DEMO: کاهش ابعاد و خوشه بندی DEMO: Dimensionality Reduction and Clustering

  • تکلیف: T-SNE و K-Means Clustering ASSIGNMENT: T-SNE & K-Means Clustering

  • راه حل: T-SNE & K-Means Clustering SOLUTION: T-SNE & K-Means Clustering

  • خوراکی های کلیدی Key Takeaways

  • کاهش ابعاد Dimensionality Reduction

توصیه کنندگان Recommenders

  • بخش مقدمه Section Introduction

  • مبانی توصیه کنندگان Recommenders Basics

  • فیلترینگ مبتنی بر محتوا Content-Based Filtering

  • شباهت کسینوس Cosine Similarity

  • شباهت کسینوس در پایتون Cosine Similarity in Python

  • ایجاد یک توصیه فیلترینگ مبتنی بر محتوا Making a Content Based Filtering Recommendation

  • تکلیف: فیلتر مبتنی بر محتوا ASSIGNMENT: Content-Based Filtering

  • راه حل: فیلتر مبتنی بر محتوا SOLUTION: Content-Based Filtering

  • فیلتر مشارکتی Collaborative Filtering

  • ماتریس آیتم کاربر User-Item Matrix

  • تکلیف: ماتریس کاربر- آیتم ASSIGNMENT: User-Item Matrix

  • راه حل: ماتریس کاربر مورد SOLUTION: User-Item Matrix

  • تجزیه مقدار منفرد Singular Value Decomposition

  • تجزیه ارزش منفرد در پایتون Singular Value Decomposition in Python

  • تکلیف: تجزیه ارزش مفرد ASSIGNMENT: Singular Value Decomposition

  • راه حل: تجزیه ارزش مفرد SOLUTION: Singular Value Decomposition

  • انتخاب تعداد اجزاء Choosing the Number of Components

  • DEMO: انتخاب تعداد اجزا DEMO: Choosing the Number of Components

  • تکلیف: انتخاب تعداد اجزا ASSIGNMENT: Choosing the Number of Components

  • راه حل: انتخاب تعداد اجزاء SOLUTION: Choosing the Number of Components

  • ایجاد یک توصیه فیلتر مشارکتی Making a Collaborative Filtering Recommendation

  • DEMO: ایجاد یک توصیه فیلتر مشارکتی DEMO: Making a Collaborative Filtering Recommendation

  • تکلیف: فیلتر مشارکتی ASSIGNMENT: Collaborative Filtering

  • راه حل: فیلتر مشارکتی SOLUTION: Collaborative Filtering

  • توصیه مراحل بعدی Recommender Next Steps

  • DEMO: رویکرد ترکیبی DEMO: Hybrid Approach

  • خوراکی های کلیدی Key Takeaways

  • توصیه کنندگان Recommenders

پروژه: توصیه رستوران ها PROJECT: Recommending Restaurants

  • بررسی اجمالی پروژه Project Overview

  • راه حل: آماده سازی داده ها SOLUTION: Data Prep

  • راه حل: TruncatedSVD SOLUTION: TruncatedSVD

  • راه حل: شباهت کسینوس SOLUTION: Cosine Similarity

  • راه حل: توصیه ها SOLUTION: Recommendations

بررسی آموزش بدون نظارت Unsupervised Learning Review

  • بخش مقدمه Section Introduction

  • نمودار جریان یادگیری بدون نظارت Unsupervised Learning Flow Chart

  • تکنیک ها و کاربردهای یادگیری بدون نظارت Unsupervised Learning Techniques & Applications

  • یادگیری بدون نظارت در گردش کار علم داده Unsupervised Learning in the Data Science Workflow

  • خوراکی های کلیدی Key Takeaways

پروژه نهایی Final Project

  • بررسی اجمالی نهایی پروژه Final Project Overview

  • راه حل: آماده سازی داده و EDA SOLUTION: Data Prep & EDA

  • راه حل: خوشه بندی SOLUTION: Clustering

  • راه حل: PCA SOLUTION: PCA

  • راه حل: خوشه بندی (دور 2) SOLUTION: Clustering (Round 2)

  • راه حل: PCA (دور 2) SOLUTION: PCA (Round 2)

  • راه حل: EDA در خوشه ها SOLUTION: EDA on Clusters

  • راه حل: توصیه ها SOLUTION: Recommendations

مراحل بعدی Next Steps

  • درس جایزه BONUS LESSON

نمایش نظرات

آموزش علم داده در پایتون: یادگیری بدون نظارت
جزییات دوره
16.5 hours
202
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
585
4.8 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Maven Analytics Maven Analytics

برنده جایزه تجزیه و تحلیل و آموزش هوش تجاری

Alice Zhao Alice Zhao

مدرس علم داده در Maven Analytics