آموزش علم داده و یادگیری ماشین با پایتون - دست به کار شوید!

Data Science and Machine Learning with Python - Hands On!

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

دانشمندان داده یکی از پردرآمدترین مشاغل را دارند که طبق گفته‌های Glassdoor و Indeed، میانگین حقوق 120000 دلار است. این فقط میانگین است! و این فقط در مورد پول نیست - کار جالبی نیز هست!

اگر تجربه برنامه نویسی یا اسکریپت نویسی دارید، این دوره تکنیک های مورد استفاده توسط دانشمندان داده واقعی در صنعت فناوری را به شما آموزش می دهد - و شما را برای حرکت به این مسیر شغلی داغ آماده می کند. این دوره جامع شامل   68 سخنرانی   است که تقریباً   9 ساعت ویدیو را در بر می گیرد و بیشتر موضوعات شامل   کدهای پایتون عملی است. نمونه هایی که می توانید برای مرجع و تمرین استفاده کنید. من از   تجربه 9 ساله خود در آمازون و IMDb   استفاده خواهم کرد تا شما را در مورد آنچه مهم است و چه چیزی مهم نیست راهنمایی کنم.

هر مفهوم به زبان انگلیسی ساده معرفی شده است، و از گیج شدن نمادهای ریاضی و اصطلاحات تخصصی جلوگیری می شود. سپس با استفاده از کد پایتون نشان داده می‌شود که می‌توانید با آن آزمایش کنید و روی آن بسازید، همراه با یادداشت‌هایی که می‌توانید برای مراجع بعدی نگه دارید. شما در این دوره پوشش آکادمیک و عمیقاً ریاضی این الگوریتم ها را نخواهید یافت - تمرکز بر درک عملی و کاربرد آنها است.

موضوعات این دوره از تجزیه و تحلیل الزامات واقعی در فهرست‌های شغلی دانشمندان داده از بزرگترین کارفرمایان فناوری می‌آیند. ما تکنیک‌های یادگیری ماشین و داده‌کاوی را که کارفرمایان واقعی به دنبال آن هستند، از جمله:

پوشش خواهیم داد
  • تحلیل رگرسیون
  • K-Means Clustering
  • تجزیه و تحلیل مؤلفه اصلی
  • آموزش/آزمایش و اعتبارسنجی متقابل
  • روشهای بیزی
  • درختان تصمیم و جنگل های تصادفی
  • رگرسیون چند متغیره
  • مدل های چند سطحی
  • ماشین‌های بردار پشتیبانی
  • یادگیری تقویتی
  • فیلتر مشارکتی
  • K-نزدیکترین همسایه
  • مبادله تعصب/واریانس
  • آموزش گروهی
  • فرکانس اصطلاح/فرکانس معکوس سند
  • طراحی آزمایشی و آزمون های A/B


...و خیلی بیشتر! همچنین یک بخش کامل   در مورد یادگیری ماشین با Apache Spark وجود دارد که به شما امکان می‌دهد این تکنیک‌ها را به «داده‌های بزرگ» تجزیه‌وتحلیل شده در یک خوشه محاسباتی ارتقا دهید.

اگر تازه وارد پایتون هستید، نگران نباشید - دوره با یک دوره خراب شروع می شود. اگر قبلاً برنامه نویسی انجام داده اید، باید سریع آن را انتخاب کنید. این دوره به شما نشان می دهد که چگونه بر روی رایانه های شخصی مبتنی بر ویندوز مایکروسافت راه اندازی کنید. کد نمونه روی سیستم‌های دسکتاپ MacOS یا Linux نیز اجرا می‌شود، اما من نمی‌توانم از آنها پشتیبانی ویژه سیستم‌عامل ارائه کنم.

اگر برنامه نویسی هستید که به دنبال تغییر مسیر شغلی جدید و هیجان انگیز هستید، یا یک تحلیلگر داده هستید که به دنبال انتقال به صنعت فناوری است - این دوره تکنیک های اساسی مورد استفاده توسط دانشمندان داده صنعت دنیای واقعی را به شما آموزش می دهد. فکر می کنم از آن لذت خواهید برد!



فایل SkillShareProject.zip پیوست شده را از حالت فشرده خارج کنید و فایل FinalProject-SkillShare.ipynb را برای چالش نهایی خود باز کنید!

وظیفه شما این است که از یادگیری ماشینی برای طبقه بندی توده های موجود در ماموگرافی به عنوان خوش خیم یا بدخیم استفاده کنید. شما از انواع تکنیک های طبقه بندی که در این دوره توضیح داده شده است استفاده خواهید کرد و خواهید دید که چگونه آنها را از نظر دقت مقایسه می کنند.

وقتی کارتان تمام شد، راه حل من در نوت بوک FinalProjectSolution-SkillShare.ipynb است. قبل از اینکه کارتان تمام شود، نگاهی به چشم نمی‌اندازید!


سرفصل ها و درس ها

درس ها Lessons

  • یافتن شباهت های فیلم Finding Movie Similarities

  • کاهش ابعاد؛ تجزیه و تحلیل مؤلفه های اصلی Dimensionality Reduction; Principal Component Analysis

  • بهبود نتایج شباهت های فیلم Improving the Results of Movie Similarities

  • TF/IDF TF / IDF

  • کوواریانس و همبستگی Covariance and Correlation

  • فیلتر مشارکتی مبتنی بر کاربر User-Based Collaborative Filtering

  • مدیریت داده های نامتعادل: نمونه برداری بیش از حد، نمونه برداری کم، و SMOTE Handling Unbalanced Data: Oversampling, Undersampling, and SMOTE

  • دستورالعمل راه اندازی لینوکس Linux Setup Instructions

  • آموزش نظارت شده در مقابل یادگیری بدون نظارت، آموزش/آزمون Supervised vs. Unsupervised Learning, Train / Test

  • اندازه گیری آنتروپی Measuring Entropy

  • استفاده از قطار/آزمایش برای جلوگیری از نصب بیش از حد Using Train/Test to Prevent Overfitting

  • مدل های چند سطحی Multi-Level Models

  • راه حل تمرین: احتمال شرطی Exercise Solution: Conditional Probability

  • معرفی پانداها Intro to Pandas

  • تشخیص نقاط پرت Detecting Outliers

  • مبانی پایتون، قسمت 2 Python Basics, Part 2

  • استفاده از KNN برای پیش بینی رتبه بندی یک فیلم Using KNN to Predict a Rating for a Movie

  • جستجوی ویکی پدیا با اسپارک Searching Wikipedia with Spark

  • رگرسیون چندگانه Multiple Regression

  • دوره تصادف در matplotlib A Crash Course in matplotlib

  • خوشه بندی افراد بر اساس درآمد و سن Clustering People by Income and Age

  • روش های بیزی: مفاهیم Bayesian Methods: Concepts

  • فیلتر مشارکتی مبتنی بر آیتم Item-Based Collaborative Filtering

  • دستورالعمل های راه اندازی مک Mac Setup Instructions

  • عملی با Q-Learning Hands-On with Q-Learning

  • استقرار مدل ها در تولید Deploying Models to Production

  • مثال PCA با مجموعه داده های Iris PCA Example with the Iris Data Set

  • پاک کردن داده های گزارش وب Cleaning Web Log Data

  • دست به کار با T-Tests Hands-On with T-Tests

  • استفاده از SVM برای خوشه بندی افراد Using SVM to Cluster People

  • لینوکس: نصب Graphviz Linux: Installing Graphviz

  • میانگین، میانه، حالت Mean, Median, Mode

  • K-نزدیکترین همسایگان: مفاهیم K-Nearest-Neighbors: Concepts

  • آموزش گروهی Ensemble Learning

  • تنوع و انحراف استاندارد Variation and Standard Deviation

  • نصب Spark - قسمت 2 Installing Spark - Part 2

  • گوچاهای تست A/B A/B Test Gotchas

  • K-Means Clustering K-Means Clustering

  • مقدمه Introduction

  • تعصب/مبادله واریانس Bias / Variance Tradeoff

  • قضیه بیز Bayes' Theorem

  • معرفی جرقه Spark Introduction

  • درختان تصمیم: مفاهیم Decision Trees: Concepts

  • بهبود نتایج توصیه‌کننده Improving the Recommender's Results

  • K-Means Clustering در Spark K-Means Clustering in Spark

  • [فعالیت] XGBoost [Activity] XGBoost

  • پاکسازی و عادی سازی داده ها Data Cleaning and Normalization

  • K-Fold Cross Validation K-Fold Cross Validation

  • یادگیری تقویتی Reinforcement Learning

  • مبانی پایتون، قسمت 3 Python Basics, Part 3

  • تمرین: احتمال شرطی Exercise: Conditional Probability

  • تعیین مدت زمان اجرای یک آزمایش Determining How Long to Run an Experiment

  • نمای کلی ماشین‌های بردار پشتیبانی (SVM). Support Vector Machines (SVM) Overview

  • استفاده از میانگین، رسانه و حالت در پایتون Using mean, media, and mode in Python

  • ذخیره سازی داده ها؛ ETL و ELT Data Warehousing; ETL and ELT

  • مفاهیم تست A/B A/B Testing Concepts

  • دستورالعمل های راه اندازی ویندوز Windows Setup Instructions

  • ویندوز: نصب Graphviz Windows: Installing Graphviz

  • درک یک ماتریس سردرگمی Understanding a Confusion Matrix

  • تکنیک های انتساب برای داده های از دست رفته Imputation Techniques for Missing Data

  • رگرسیون خطی Linear Regression

  • توصیه فیلم به مردم Making Movie Recommendations to People

  • تابع چگالی احتمال. تابع جرم احتمال Probability Density Function; Probability Mass Function

  • عادی سازی داده های عددی Normalizing Numerical Data

  • درختان تصمیم در اسپارک Decision Trees in Spark

  • درختان تصمیم: پیش بینی تصمیمات استخدام Decision Trees: Predicting Hiring Decisions

  • T-Test و P-Values T-Tests and P-Values

  • معرفی MLLib Introducing MLLib

  • استفاده از Spark 2 DataFrame API برای MLLib Using the Spark 2 DataFrame API for MLLib

  • پیاده سازی یک طبقه بندی کننده هرزنامه با Naive Bayes Implementing a Spam Classifier with Naive Bayes

  • Binning، Transforming، Encoding، Scaling و Shuffling Binning, Transforming, Encoding, Scaling, and Shuffling

  • توزیع داده های رایج Common Data Distributions

  • طبقه بندی کننده های اندازه گیری (دقت، فراخوان، F1، ROC، AUC) Measuring Classifiers (Precision, Recall, F1, ROC, AUC)

  • مهندسی ویژگی و نفرین ابعاد Feature Engineering and the Curse of Dimensionality

  • تجسم داده ها با Seaborn Data Visualization with Seaborn

  • مبانی پایتون، قسمت 4 Python Basics, Part 4

  • رگرسیون چند جمله ای Polynomial Regression

  • صدک ها و لحظه ها Percentiles and Moments

  • مک: نصب Graphviz Mac: Installing Graphviz

  • نصب Spark - قسمت 1 Installing Spark - Part 1

  • Spark و مجموعه داده های توزیع شده انعطاف پذیر (RDD) Spark and the Resilient Distributed Dataset (RDD)

  • انواع داده ها Types of Data

  • مبانی پایتون، قسمت 1 Python Basics, Part 1

  • نکات مهم نصب اسپارک Important Spark Installation Notes

نمایش نظرات

آموزش علم داده و یادگیری ماشین با پایتون - دست به کار شوید!
جزییات دوره
10h 38m
84
Skillshare (اسکیل شیر) Skillshare (اسکیل شیر)
(آخرین آپدیت)
12,650
4 از 5
دارد
دارد
دارد
Frank Kane
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Frank Kane Frank Kane

یادگیری ماشین و داده های بزرگ، آمازون سابق

فرانک 9 سال را در آمازون و IMDb گذراند و فناوری را توسعه و مدیریت کرد که به طور خودکار توصیه های محصول و فیلم را به صدها میلیون مشتری ارائه می دهد. زمان. فرانک دارای 17 حق ثبت اختراع صادر شده در زمینه های محاسبات توزیع شده ، داده کاوی و یادگیری ماشین است. در سال 2012، فرانک شرکت موفق خود را به نام Sundog Software راه اندازی کرد که بر فناوری محیط واقعیت مجازی تمرکز دارد و به دیگران در مورد تجزیه و تحلیل داده های بزرگ آموزش می دهد.