آموزش تجزیه و تحلیل پیش بینی با استفاده از Apache Spark MLlib در Databricks

Predictive Analytics Using Apache Spark MLlib on Databricks

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: این دوره به شما می آموزد که تکنیک های مهم برای تجزیه و تحلیل پیش بینی کننده مانند رگرسیون و طبقه بندی را با استفاده از Apache Spark MLlib در Databricks درک و پیاده سازی کنید. موتور تجزیه و تحلیل یکپارچه Spark یکی از محبوب ترین چارچوب ها برای تجزیه و تحلیل و پردازش کلان داده است. Spark APIهای بسیار جامع و آسان برای استفاده را برای یادگیری ماشین ارائه می دهد که می توانید از آنها برای ایجاد مدل های پیش بینی برای رگرسیون و طبقه بندی و داده های پیش پردازش برای تغذیه این مدل ها استفاده کنید. در این دوره آموزشی، تحلیل پیشگویانه با استفاده از Apache Spark MLlib در Databricks، پیاده سازی مدل های یادگیری ماشینی با استفاده از Spark ML APIs را خواهید آموخت. ابتدا، کتابخانه‌های مختلف Spark موجود برای یادگیری ماشین، کتابخانه قدیمی‌تر مبتنی بر RDD و کتابخانه جدیدتر مبتنی بر DataFrame را درک خواهید کرد. سپس دامنه ترانسفورماتورهای موجود در Spark را برای پیش پردازش داده ها برای یادگیری ماشین بررسی خواهید کرد - مانند ترانسفورماتورهای مقیاس بندی و استانداردسازی برای داده های عددی و رمزگذاری برچسب و ترانسفورماتورهای رمزگذاری یک داغ برای داده های طبقه بندی شده. در مرحله بعد، شما از مدل های رگرسیون خطی و مجموعه ای مانند جنگل های تصادفی و درختان تقویت شده با گرادیان برای ساخت مدل های رگرسیون استفاده خواهید کرد. شما از این مدل ها برای پیش بینی داده های دسته ای استفاده خواهید کرد. علاوه بر این، همچنین خواهید دید که چگونه می توانید از Spark ML Pipelines برای به هم پیوستن ترانسفورماتورها و برآوردگرها برای ایجاد یک گردش کار کامل یادگیری ماشین استفاده کنید. در نهایت، شما مدل های طبقه بندی را با استفاده از رگرسیون لجستیک و همچنین درخت های تصمیم پیاده سازی خواهید کرد. شما مدل ML را با استفاده از داده‌های دسته‌ای آموزش می‌دهید، اما پیش‌بینی‌هایی را در جریان داده‌ها انجام می‌دهید. همچنین از تنظیم هایپرپارامتر و اعتبارسنجی متقابل برای یافتن بهترین مدل برای داده های خود استفاده خواهید کرد. پس از اتمام این دوره، مهارت ها و دانش لازم برای ایجاد مدل های ML با Spark MLlib را خواهید داشت که برای انجام تجزیه و تحلیل پیش بینی با استفاده از یادگیری ماشین لازم است.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

شروع یادگیری ماشین با Apache Spark در Databricks Getting Started with Machine Learning with Apache Spark on Databricks

  • بررسی نسخه Version Check

  • پیش نیازها و رئوس مطالب دوره Prerequisites and Course Outline

  • یادگیری ماشین در آپاچی اسپارک Machine Learning on Apache Spark

  • نسخه ی نمایشی: پیکربندی فضای کاری و تنظیم یک نوت بوک Demo: Configuring the Workspace and Setting up a Notebook

  • نسخه ی نمایشی: بررسی مجموعه داده های دیابت Demo: Exploring the Diabetes Dataset

  • نسخه ی نمایشی: استانداردسازی و مقیاس بندی Demo: Standardization and Scaling

  • نسخه ی نمایشی: عادی سازی Demo: Normalization

  • نسخه ی نمایشی: تبدیل مقادیر پیوسته به ارزش های طبقه ای Demo: Converting Continuous Values to Categorical Values

  • نسخه ی نمایشی: توکن کردن داده های متنی Demo: Tokenizing Text Data

  • نسخه ی نمایشی: رمزگذاری برچسب و رمزگذاری تک داغ Demo: Label Encoding and One-hot Encoding

  • نسخه ی نمایشی: انتخاب ویژگی Demo: Feature Selection

انجام رگرسیون بر روی داده های دسته ای Performing Regression on Batch Data

  • مروری سریع بر رگرسیون خطی Quick Overview of Linear Regression

  • Lasso Ridge و رگرسیون خالص الاستیک Lasso Ridge and Elastic Net Regression

  • نسخه ی نمایشی: بررسی مجموعه داده های امید به زندگی Demo: Exploring the Life Expectancy Dataset

  • نسخه ی نمایشی: ساخت و ارزیابی یک مدل رگرسیون خطی Demo: Building and Evaluating a Linear Regression Model

  • نسخه ی نمایشی: تنظیم فراپارامتر Demo: Hyperparameter Tuning

  • مروری سریع بر یادگیری گروه Quick Overview of Ensemble Learning

  • میانگین گیری و تقویت Averaging and Boosting

  • خطوط لوله یادگیری ماشین Machine Learning Pipelines

  • نسخه ی نمایشی: بررسی مجموعه داده های انتشار CO2 Demo: Exploring the CO2 Emissions Dataset

  • نسخه ی نمایشی: رگرسیون تصادفی جنگل Demo: Random Forest Regression

  • نسخه ی نمایشی: رگرسیون درختی تقویت شده با گرادیان Demo: Gradient Boosted Tree Regression

پیاده سازی طبقه بندی در جریان داده ها Implementing Classification on Streaming Data

  • مروری سریع بر رگرسیون لجستیک Quick Overview of Logistic Regression

  • نسخه ی نمایشی: کاوش مجموعه داده های وام Demo: Exploring the Loan Dataset

  • نسخه ی نمایشی: رگرسیون لجستیک Demo: Logistic Regression

  • نسخه ی نمایشی: انجام پیش بینی در جریان داده ها Demo: Performing Predictions on Streaming Data

  • بررسی اجمالی سریع درختان تصمیم Quick Overview of Decision Trees

  • نسخه ی نمایشی: بررسی مجموعه داده های کمپین بازاریابی بانکی Demo: Exploring the Bank Marketing Campaign Dataset

  • نسخه ی نمایشی: طبقه بندی درخت تصمیم Demo: Decision Tree Classifier

  • نسخه ی نمایشی: تنظیم Hyperparameter with Cross Validation Demo: Hyperparameter Tuning with Cross Validation

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش تجزیه و تحلیل پیش بینی با استفاده از Apache Spark MLlib در Databricks
جزییات دوره
1h 57m
32
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.