آموزش جرقه ای برای یادگیری ماشین و هوش مصنوعی

Spark for Machine Learning & AI

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: Apache Spark یکی از پرکاربردترین و پشتیبانی شده ترین ابزارهای منبع باز برای یادگیری ماشین و داده های بزرگ است. در این دوره ، نحوه کار با این بستر قدرتمند برای یادگیری ماشین را کشف کنید. مربی دن سالیوان در مورد MLlib - کتابخانه یادگیری ماشین Spark - بحث می کند که ابزاری را برای دانشمندان و تحلیل گران داده فراهم می کند که ترجیح می دهند راه حل هایی برای مشکلات تجاری پیدا کنند تا کدگذاری ، آزمایش و نگهداری کتابخانه های یادگیری ماشین خود. وی نحوه استفاده از DataFrames برای سازماندهی ساختار داده را نشان می دهد ، و تهیه داده ها و انواع متداول الگوریتم های یادگیری ماشین را شامل می شود: خوشه بندی ، طبقه بندی ، رگرسیون و توصیه ها. با پایان دوره ، شما تجربه بارگذاری داده ها در Spark ، پیش پردازش داده ها را در صورت لزوم برای استفاده از الگوریتم های MLlib و استفاده از این الگوریتم ها برای انواع مشکلات یادگیری ماشین خواهید داشت.
موضوعات شامل:
  • گردش کار یادگیری ماشین
  • سازماندهی داده ها در DataFrames
  • مراحل پیش پردازش و آماده سازی داده ها برای یادگیری ماشین
  • خوشه بندی داده ها
  • الگوریتم های طبقه بندی
  • روشهای رگرسیون موجود در Spark MLlib
  • رویکردهای متداول در طراحی سیستم های توصیه

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

1. آشنایی با جرقه و MLlib 1. Introduction to Spark and MLlib

  • آشنایی با جرقه Introduction to Spark

  • مراحل در فرایند یادگیری ماشین Steps in the machine learning process

  • جرقه را نصب کنید Install Spark

  • سازماندهی داده ها در DataFrames Organizing data in DataFrames

  • اجزای جرقه MLlib Components of Spark MLlib

2. تهیه و تبدیل داده ها 2. Data Preparation and Transformation

  • مقدمه ای برای پیش پردازش Introduction to preprocessing

  • عادی سازی داده های عددی Normalize numeric data

  • داده های عددی را استاندارد کنید Standardize numeric data

  • داده های عددی سطل را بزنید Bucketize numeric data

  • داده های متن را نشان دهید Tokenize text data

  • TF-IDF TF-IDF

  • خلاصه پیش پردازش Summary of preprocessing

3. خوشه بندی 3. Clustering

  • آشنایی با خوشه بندی Introduction to clustering

  • K- به معنی خوشه بندی است K-means clustering

  • خوشه بندی سلسله مراتبی Hierarchical clustering

  • خلاصه تکنیک های خوشه بندی Summary of clustering techniques

4- طبقه بندی 4. Classification

  • مقدمه ای برای طبقه بندی Introduction to classification

  • پردازش مجموعه داده های Iris Preprocessing the Iris data set

  • طبقه بندی ساده بیز Naive Bayes classification

  • طبقه بندی پرسپترون چند لایه Multilayer perceptron classification

  • طبقه بندی درخت تصمیم گیری Decision trees classification

  • خلاصه الگوریتم های طبقه بندی Summary of classification algorithms

5- رگرسیون 5. Regression

  • آشنایی با رگرسیون Introduction to regresssion

  • پیش پردازش داده های رگرسیون Preprocessing regression data

  • رگرسیون خطی Linear regression

  • رگرسیون درخت تصمیم گیری Decision tree regression

  • رگرسیون درخت رشد شیب Gradient-boosted tree regression

  • خلاصه الگوریتم های رگرسیون Summary of regression algorithms

6. توصیه ها 6. Recommendations

  • سیستم های توصیه را درک کنید Understand recommendation systems

  • فیلتر همکاری Collaborative filtering

نتیجه Conclusion

  • نکاتی در مورد استفاده از Spark MLlib Tips for using Spark MLlib

نمایش نظرات

آموزش جرقه ای برای یادگیری ماشین و هوش مصنوعی
جزییات دوره
1h 51m
32
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
94,912
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.