آموزش ساخت مدل های یادگیری ماشین در Spark 2

Building Machine Learning Models in Spark 2

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: آموزش مدل‌های ML یک عملیات محاسباتی فشرده است و بهتر است در یک محیط توزیع شده انجام شود. این دوره به شما می آموزد که چگونه Spark می تواند به طور کارآمد کاوش داده ها، تمیز کردن، جمع آوری و آموزش مدل های ML را روی یک پلت فرم انجام دهد. Spark احتمالاً محبوب ترین موتور برای پردازش کلان داده این روزها است. در این دوره آموزشی، ساخت مدل‌های یادگیری ماشین در Spark 2، ساخت و آموزش مدل‌های یادگیری ماشین (ML) مانند رگرسیون، طبقه‌بندی، خوشه‌بندی و سیستم‌های توصیه در محیط پردازش توزیع شده Spark 2.x را خواهید آموخت. این دوره با معرفی 2 کتابخانه ML موجود در Spark 2 شروع می شود. کتابخانه قدیمی spark.mllib که بر روی RDD ها ساخته شده است و کتابخانه جدیدتر spark.ml که بر روی دیتافریم ها ساخته شده است. شما این دو را در مقایسه خواهید دید تا به شما کمک کند بدانید چه زمانی باید یکی را بر دیگری انتخاب کنید. یک مدل طبقه بندی را خواهید دید که با استفاده از Decision Trees به روش قدیمی ساخته شده است، و خواهید دید که چگونه می توانید همان مدل را در کتابخانه جدیدتر spark.ml پیاده سازی کنید. این دوره بسیاری از ویژگی های Spark 2 را پوشش می دهد، از جمله مرور یک ویژگی کاملاً جدید در Spark 2، خطوط لوله ML که برای زنجیره تبدیل داده ها و عملیات ML استفاده می شود. در پایان این دوره با استفاده از ویژگی های پیشرفته ای که Spark 2 برای یادگیری ماشین ارائه می دهد، راحت خواهید بود. شما یاد خواهید گرفت که از اجزایی مانند ترانسفورماتورها، برآوردگرها و پارامترها در خطوط لوله ML خود برای کار با آموزش توزیع شده در مقیاس استفاده کنید.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

بسته های یادگیری ماشین: spark.mllib در مقابل spark.ml Machine Learning Packages: spark.mllib vs. spark.ml

  • بررسی نسخه Version Check

  • نمای کلی ماژول Module Overview

  • پیش نیازها و بررسی اجمالی دوره Prerequisites and Course Overview

  • RDDs: The Building Blocks of Spark RDDs: The Building Blocks of Spark

  • DataFrames در Spark 2 DataFrames in Spark 2

  • نسخه ی نمایشی: Spark 2 نصب و کار با نوت بوک های Jupyter Demo: Spark 2 Installation and Working with Jupyter Notebooks

  • spark.mllib در مقابل spark.ml spark.mllib vs. spark.ml

  • معرفی درختان تصمیم Introducing Decision Trees

  • ناخالصی جینی و جوانب مثبت و منفی درختان تصمیم Gini Impurity and Pros and Cons of Decision Trees

  • نسخه ی نمایشی: راه اندازی اولیه پروژه Demo: Basic Project Setup

  • نسخه ی نمایشی: طبقه بندی شراب با استفاده از درختان تصمیم در spark.mllib Demo: Wine Classification Using Decision Trees in spark.mllib

  • نسخه ی نمایشی: کار با فرمت داده LIBSVM Demo: Working with the LIBSVM Data Format

  • نسخه ی نمایشی: درختان تصمیم با استفاده از فرمت داده LIBSVM Demo: Decision Trees Using the LIBSVM Data Format

طبقه بندی ساختمان و مدل های رگرسیون در Spark ML Building Classification and Regression Models in Spark ML

  • نمای کلی ماژول Module Overview

  • خطوط لوله ML، برآوردگرها و ترانسفورماتورها ML Pipelines, Estimators, and Transformers

  • مراحل آموزش و پیش بینی خط لوله Training and Prediction Pipeline Stages

  • مهندسی ویژگی Feature Engineering

  • استخراج کننده های ویژگی Feature Extractors

  • ترانسفورماتورهای ویژه Feature Transformers

  • انتخابگرهای ویژگی و هش حساس به محل Feature Selectors and Locality Sensitive Hashing

  • ماتریس سردرگمی: دقت، دقت، یادآوری، امتیاز F1 The Confusion Matrix: Accuracy, Precision, Recall, F1 Score

  • نسخه ی نمایشی: طبقه بندی شراب با استفاده از درختان تصمیم در Spark ML Demo: Wine Classification Using Decision Trees in Spark ML

  • نسخه ی نمایشی: تبدیل داده های دسته بندی به مقادیر عددی Demo: Converting Categorical Data to Numeric Values

  • نسخه ی نمایشی: طبقه بندی درخت تصمیم Demo: The Decision Tree Classifier

  • جنگل های تصادفی Random Forests

  • نسخه ی نمایشی: طبقه بندی درآمد با استفاده از جنگل های تصادفی Demo: Income Classification Using Random Forests

  • نسخه ی نمایشی: با استفاده از خطوط لوله ML Demo: Using ML Pipelines

  • نسخه ی نمایشی: پیش بینی ها با استفاده از جنگل تصادفی Demo: Predictions Using the Random Forest

  • معرفی مدل های رگرسیون منظم برای جلوگیری از برازش بیش از حد Introducing Regularized Regression Models to Prevent Overfitting

  • رگرسیون کمند و ریج Lasso and Ridge Regression

  • نسخه ی نمایشی: رگرسیون خطی با پارامتر خالص الاستیک Demo: Linear Regression with the Elastic Net Param

  • نسخه ی نمایشی: پیش بینی ها با استفاده از مدل رگرسیون Demo: Predictions Using the Regression Model

  • نسخه ی نمایشی: تنظیم فراپارامتر Demo: Hyperparameter Tuning

اجرای خوشه بندی و کاهش ابعاد در Spark ML Implementing Clustering and Dimensionality Reduction in Spark ML

  • نمای کلی ماژول Module Overview

  • تکنیک های یادگیری تحت نظارت و بدون نظارت Supervised and Unsupervised Learning Techniques

  • اهداف خوشه بندی Clustering Objectives

  • تجسم K-به معنای خوشه بندی است Visualizing K-means Clustering

  • تعداد خوشه ها به عنوان یک فراپارامتر: روش آرنج و سیلوئت Number of Clusters as a Hyperparameter: The Elbow and Silhouette Method

  • نسخه ی نمایشی: K-به معنی خوشه بندی در مجموعه داده تایتانیک است Demo: K-means Clustering on the Titanic Dataset

  • نسخه ی نمایشی: کاوش خوشه ها Demo: Exploring Clusters

  • تجزیه و تحلیل مؤلفه اصلی: شهود Principal Component Analysis: Intuition

  • نسخه ی نمایشی: مدل رگرسیون بدون PCA Demo: Regression Model Without PCA

  • نسخه ی نمایشی: انجام رگرسیون بر روی اجزای اصلی Demo: Performing Regression on Principal Components

سیستم های توصیه ساختمان در Spark ML Building Recommendation Systems in Spark ML

  • نمای کلی ماژول Module Overview

  • فیلتر مبتنی بر محتوا و مشارکتی Content-based and Collaborative Filtering

  • تخمین ماتریس رتبه بندی Estimating the Ratings Matrix

  • روش حداقل مربعات متناوب The Alternating Least Squares Method

  • رتبه بندی صریح و ضمنی Explicit and Implicit Ratings

  • استراتژی های شروع سرد و محاسبه شدت Cold Start Strategies and Compute Intensity

  • نسخه ی نمایشی: ساختن یک سیستم توصیه با استفاده از رتبه بندی های صریح Demo: Building a Recommendation System Using Explicit Ratings

  • نسخه ی نمایشی: دریافت توصیه های فیلم برای کاربران خاص Demo: Getting Movie Recommendations for Specific Users

  • نسخه ی نمایشی: ساخت یک سیستم توصیه با استفاده از رتبه بندی ضمنی Demo: Building a Recommendation System Using Implicit Ratings

  • نسخه ی نمایشی: دریافت توصیه های هنرمند برای کاربران خاص Demo: Getting Artist Recommendations for Specific Users

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش ساخت مدل های یادگیری ماشین در Spark 2
جزییات دوره
3h 27m
55
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
36
4.7 از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.