دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش یادگیری ماشین مقیاس‌پذیر روی داده‌های بزرگ (Big Data) با استفاده از Apache Spark - آخرین آپدیت

دانلود Scalable Machine Learning on Big Data using Apache Spark

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: این دوره شما را با مهارت‌های لازم برای مقیاس‌بندی وظایف علوم داده و یادگیری ماشین (ML) روی مجموعه‌های داده‌های بزرگ با استفاده از Apache Spark آشنا می‌کند. اکثر پروژه‌های یادگیری ماشین در دنیای واقعی شامل مجموعه‌های داده بسیار بزرگی هستند که فراتر از محدودیت‌های CPU، حافظه و فضای ذخیره‌سازی یک کامپیوتر واحد می‌باشند. آپاچی اسپارک (Apache Spark) یک فریم‌ورک متن‌باز است که از محاسبات خوشه‌ای (Cluster Computing) و ذخیره‌سازی توزیع‌شده برای پردازش مجموعه‌های داده بسیار حجیم به روشی کارآمد و مقرون‌به‌صرفه استفاده می‌کند. بنابراین، داشتن دانش کاربردی در کار با Apache Spark یک دارایی ارزشمند و یک تمایز بالقوه برای مهندسان یادگیری ماشین است. پس از اتمام این دوره، شما قادر خواهید بود: - درک عملی از Apache Spark به دست آورید و آن را برای حل مسائل یادگیری ماشین در هر دو مقیاس داده‌های کوچک و بزرگ به کار ببرید. - نحوه نوشتن کدهای موازی که قادر به اجرا روی هزاران CPU هستند را درک کنید. - از خوشه‌های محاسباتی مقیاس بزرگ برای اعمال الگوریتم‌های یادگیری ماشین روی پتابایت‌ها داده با استفاده از SparkML Pipelines استفاده کنید. - خطاهای کمبود حافظه (Out-of-Memory) را که در فریم‌ورک‌های سنتی یادگیری ماشین هنگام عدم گنجایش داده‌ها در حافظه اصلی رخ می‌دهد، حذف کنید. - هزاران مدل مختلف ML را به صورت موازی تست کنید تا بهترین مدل را بیابید (تکنیکی که توسط بسیاری از برندگان مسابقات Kaggle استفاده می‌شود). - (اختیاری) دستورات SQL را روی مجموعه‌های داده بسیار بزرگ با استفاده از Apache SparkSQL و API دیتافریم‌های اسپارک اجرا کنید. همین حالا ثبت‌نام کنید تا تکنیک‌های یادگیری ماشین برای کار با Big Data را بیاموزید؛ تکنیک‌هایی که با موفقیت توسط شرکت‌هایی مانند علی‌بابا، اپل، آمازون، بایدو، eBay، IBM، ناسا، سامسونگ، SAP، تریپ‌ادوایزر، یاهو، زالاندو و بسیاری دیگر به کار گرفته شده‌اند. نکته: شما در طول این دوره، وظایف یادگیری ماشین را به صورت عملی روی یک خوشه‌ی Apache Spark که توسط IBM به صورت رایگان ارائه شده است تمرین خواهید کرد و می‌توانید پس از دوره نیز به استفاده از آن ادامه دهید. پیش‌نیازها: - برنامه‌نویسی مقدماتی پایتون - مفاهیم پایه یادگیری ماشین (ویدئوهای مقدماتی اختیاری در این دوره ارائه شده است) - مهارت‌های پایه SQL برای محتوای اختیاری دوره‌های زیر پیش از شروع این کلاس توصیه می‌شوند (مگر اینکه پیش از این مهارت‌های لازم را کسب کرده باشید): - پایتون برای علوم داده کاربردی یا مشابه آن - یادگیری ماشین با پایتون یا مشابه آن - SQL برای علوم داده برای بخش‌های اختیاری

سرفصل ها و درس ها

هفته اول: مقدمه Week 1: Introduction

مقدمه‌ای بر Apache Spark برای یادگیری ماشین در داده‌های بزرگ Introduction to Apache Spark for Machine Learning on BigData
داده‌های بزرگ (Big Data) چیست؟ What is Big Data?
راهکارهای ذخیره‌سازی داده‌ها Data storage solutions
استراتژی‌های پردازش موازی داده‌ها در Apache Spark Parallel data processing strategies of Apache Spark
مبانی برنامه‌نویسی تابعی Functional programming basics
مجموعه داده‌های توزیع‌شده مقاوم (RDD)، دیتافریم‌ها و ApacheSparkSQL Resilient Distributed Dataset and DataFrames - ApacheSparkSQL

هفته دوم: مقیاس‌بندی ریاضیات برای آمار در Apache Spark Week 2: Scaling Math for Statistics on Apache Spark

میانگین‌ها Averages
انحراف معیار Standard deviation
چولگی (Skewness) Skewness
کشیدگی (Kurtosis) Kurtosis
کوواریانس، ماتریس‌های کوواریانس و همبستگی Covariance, Covariance matrices, correlation
رسم نمودار با ApacheSpark و matplotlib پایتون Plotting with ApacheSpark and python's matplotlib
کاهش ابعاد Dimensionality reduction
تحلیل مؤلفه‌های اصلی (PCA) PCA

هفته سوم: آشنایی با Apache SparkML Week 3: Introduction to Apache SparkML

نحوه عملکرد خط لوله‌های یادگیری ماشین (ML Pipelines) How ML Pipelines work
آشنایی با SparkML Introduction to SparkML
استخراج، تبدیل و بارگذاری (ETL) Extract - Transform - Load
مقدمه‌ای بر خوشه‌بندی: الگوریتم k-Means Introduction to Clustering: k-Means
استفاده از K-Means در Apache SparkML Using K-Means in Apache SparkML

هفته چهارم: یادگیری نظارت شده و نظارت نشده با SparkML Week 4: Supervised and Unsupervised learning with SparkML

رگرسیون خطی Linear Regression
رگرسیون خطی با Apache SparkML LinearRegression with Apache SparkML
رگرسیون لجستیک Logistic Regression
رگرسیون لجستیک با Apache SparkML LogisticRegression with Apache SparkML

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش یادگیری ماشین مقیاس‌پذیر روی داده‌های بزرگ (Big Data) با استفاده از Apache Spark

جزییات دوره

زمان دوره: 6h 38m

تعداد ویدیو ها: 23

شرکت: Coursera (کورسرا)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 23,948

امتیاز مرجع: 3.7 از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Romeo Kienzler

لینک کوتاه این دوره

https://donyad.com/d/3b87e1

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

بازاریابی

دیگر

علوم داده

فراگیری ماشین

آموزش یادگیری ماشین مقیاس‌پذیر روی داده‌های بزرگ (Big Data) با استفاده از Apache Spark - آخرین آپدیت

دانلود Scalable Machine Learning on Big Data using Apache Spark

هفته اول: مقدمه Week 1: Introduction

مقدمه‌ای بر Apache Spark برای یادگیری ماشین در داده‌های بزرگ Introduction to Apache Spark for Machine Learning on BigData

داده‌های بزرگ (Big Data) چیست؟ What is Big Data?

راهکارهای ذخیره‌سازی داده‌ها Data storage solutions

استراتژی‌های پردازش موازی داده‌ها در Apache Spark Parallel data processing strategies of Apache Spark

مبانی برنامه‌نویسی تابعی Functional programming basics

مجموعه داده‌های توزیع‌شده مقاوم (RDD)، دیتافریم‌ها و ApacheSparkSQL Resilient Distributed Dataset and DataFrames - ApacheSparkSQL

هفته دوم: مقیاس‌بندی ریاضیات برای آمار در Apache Spark Week 2: Scaling Math for Statistics on Apache Spark

میانگین‌ها Averages

انحراف معیار Standard deviation

چولگی (Skewness) Skewness

کشیدگی (Kurtosis) Kurtosis

کوواریانس، ماتریس‌های کوواریانس و همبستگی Covariance, Covariance matrices, correlation

رسم نمودار با ApacheSpark و matplotlib پایتون Plotting with ApacheSpark and python's matplotlib

کاهش ابعاد Dimensionality reduction

تحلیل مؤلفه‌های اصلی (PCA) PCA

هفته سوم: آشنایی با Apache SparkML Week 3: Introduction to Apache SparkML

نحوه عملکرد خط لوله‌های یادگیری ماشین (ML Pipelines) How ML Pipelines work

آشنایی با SparkML Introduction to SparkML

استخراج، تبدیل و بارگذاری (ETL) Extract - Transform - Load

مقدمه‌ای بر خوشه‌بندی: الگوریتم k-Means Introduction to Clustering: k-Means

استفاده از K-Means در Apache SparkML Using K-Means in Apache SparkML

هفته چهارم: یادگیری نظارت شده و نظارت نشده با SparkML Week 4: Supervised and Unsupervised learning with SparkML

رگرسیون خطی Linear Regression

رگرسیون خطی با Apache SparkML LinearRegression with Apache SparkML

رگرسیون لجستیک Logistic Regression

رگرسیون لجستیک با Apache SparkML LogisticRegression with Apache SparkML

نمایش نظرات

https://donyad.com/d/3b87e1

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar