آموزش یادگیری ماشین مقیاس‌پذیر روی داده‌های بزرگ (Big Data) با استفاده از Apache Spark - آخرین آپدیت

دانلود Scalable Machine Learning on Big Data using Apache Spark

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: این دوره شما را با مهارت‌های لازم برای مقیاس‌بندی وظایف علوم داده و یادگیری ماشین (ML) روی مجموعه‌های داده‌های بزرگ با استفاده از Apache Spark آشنا می‌کند. اکثر پروژه‌های یادگیری ماشین در دنیای واقعی شامل مجموعه‌های داده بسیار بزرگی هستند که فراتر از محدودیت‌های CPU، حافظه و فضای ذخیره‌سازی یک کامپیوتر واحد می‌باشند. آپاچی اسپارک (Apache Spark) یک فریم‌ورک متن‌باز است که از محاسبات خوشه‌ای (Cluster Computing) و ذخیره‌سازی توزیع‌شده برای پردازش مجموعه‌های داده بسیار حجیم به روشی کارآمد و مقرون‌به‌صرفه استفاده می‌کند. بنابراین، داشتن دانش کاربردی در کار با Apache Spark یک دارایی ارزشمند و یک تمایز بالقوه برای مهندسان یادگیری ماشین است. پس از اتمام این دوره، شما قادر خواهید بود: - درک عملی از Apache Spark به دست آورید و آن را برای حل مسائل یادگیری ماشین در هر دو مقیاس داده‌های کوچک و بزرگ به کار ببرید. - نحوه نوشتن کدهای موازی که قادر به اجرا روی هزاران CPU هستند را درک کنید. - از خوشه‌های محاسباتی مقیاس بزرگ برای اعمال الگوریتم‌های یادگیری ماشین روی پتابایت‌ها داده با استفاده از SparkML Pipelines استفاده کنید. - خطاهای کمبود حافظه (Out-of-Memory) را که در فریم‌ورک‌های سنتی یادگیری ماشین هنگام عدم گنجایش داده‌ها در حافظه اصلی رخ می‌دهد، حذف کنید. - هزاران مدل مختلف ML را به صورت موازی تست کنید تا بهترین مدل را بیابید (تکنیکی که توسط بسیاری از برندگان مسابقات Kaggle استفاده می‌شود). - (اختیاری) دستورات SQL را روی مجموعه‌های داده بسیار بزرگ با استفاده از Apache SparkSQL و API دیتافریم‌های اسپارک اجرا کنید. همین حالا ثبت‌نام کنید تا تکنیک‌های یادگیری ماشین برای کار با Big Data را بیاموزید؛ تکنیک‌هایی که با موفقیت توسط شرکت‌هایی مانند علی‌بابا، اپل، آمازون، بایدو، eBay، IBM، ناسا، سامسونگ، SAP، تریپ‌ادوایزر، یاهو، زالاندو و بسیاری دیگر به کار گرفته شده‌اند. نکته: شما در طول این دوره، وظایف یادگیری ماشین را به صورت عملی روی یک خوشه‌ی Apache Spark که توسط IBM به صورت رایگان ارائه شده است تمرین خواهید کرد و می‌توانید پس از دوره نیز به استفاده از آن ادامه دهید. پیش‌نیازها: - برنامه‌نویسی مقدماتی پایتون - مفاهیم پایه یادگیری ماشین (ویدئوهای مقدماتی اختیاری در این دوره ارائه شده است) - مهارت‌های پایه SQL برای محتوای اختیاری دوره‌های زیر پیش از شروع این کلاس توصیه می‌شوند (مگر اینکه پیش از این مهارت‌های لازم را کسب کرده باشید): - پایتون برای علوم داده کاربردی یا مشابه آن - یادگیری ماشین با پایتون یا مشابه آن - SQL برای علوم داده برای بخش‌های اختیاری

سرفصل ها و درس ها

هفته اول: مقدمه Week 1: Introduction

  • مقدمه‌ای بر Apache Spark برای یادگیری ماشین در داده‌های بزرگ Introduction to Apache Spark for Machine Learning on BigData

  • داده‌های بزرگ (Big Data) چیست؟ What is Big Data?

  • راهکارهای ذخیره‌سازی داده‌ها Data storage solutions

  • استراتژی‌های پردازش موازی داده‌ها در Apache Spark Parallel data processing strategies of Apache Spark

  • مبانی برنامه‌نویسی تابعی Functional programming basics

  • مجموعه داده‌های توزیع‌شده مقاوم (RDD)، دیتافریم‌ها و ApacheSparkSQL Resilient Distributed Dataset and DataFrames - ApacheSparkSQL

هفته دوم: مقیاس‌بندی ریاضیات برای آمار در Apache Spark Week 2: Scaling Math for Statistics on Apache Spark

  • میانگین‌ها Averages

  • انحراف معیار Standard deviation

  • چولگی (Skewness) Skewness

  • کشیدگی (Kurtosis) Kurtosis

  • کوواریانس، ماتریس‌های کوواریانس و همبستگی Covariance, Covariance matrices, correlation

  • رسم نمودار با ApacheSpark و matplotlib پایتون Plotting with ApacheSpark and python's matplotlib

  • کاهش ابعاد Dimensionality reduction

  • تحلیل مؤلفه‌های اصلی (PCA) PCA

هفته سوم: آشنایی با Apache SparkML Week 3: Introduction to Apache SparkML

  • نحوه عملکرد خط لوله‌های یادگیری ماشین (ML Pipelines) How ML Pipelines work

  • آشنایی با SparkML Introduction to SparkML

  • استخراج، تبدیل و بارگذاری (ETL) Extract - Transform - Load

  • مقدمه‌ای بر خوشه‌بندی: الگوریتم k-Means Introduction to Clustering: k-Means

  • استفاده از K-Means در Apache SparkML Using K-Means in Apache SparkML

هفته چهارم: یادگیری نظارت شده و نظارت نشده با SparkML Week 4: Supervised and Unsupervised learning with SparkML

  • رگرسیون خطی Linear Regression

  • رگرسیون خطی با Apache SparkML LinearRegression with Apache SparkML

  • رگرسیون لجستیک Logistic Regression

  • رگرسیون لجستیک با Apache SparkML LogisticRegression with Apache SparkML

نمایش نظرات