آموزش جامع بیگ دیتا (Big Data) با اسپارک و هادوپ - آخرین آپدیت

دانلود Introduction to Big Data with Spark and Hadoop

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: این دوره جامع و خودآموز IBM تمام مفاهیم کلیدی داده‌های عظیم یا بیگ دیتا را به شما آموزش می‌دهد. در این مسیر، با ویژگی‌های داده‌های حجیم و کاربردهای تحلیل آن‌ها آشنا خواهید شد و تجربه عملی کار با ابزارهای پردازش بیگ دیتا مانند Apache Hadoop و Apache Spark را کسب می‌کنید. برنارد مار، بیگ دیتا را به عنوان ردپای دیجیتالی تعریف می‌کند که ما در عصر حاضر تولید می‌کنیم. شما دوره را با درک مفهوم بیگ دیتا و بررسی نحوه استخراج بینش‌های کاربردی برای موارد مختلف آغاز خواهید کرد. همچنین با تکنولوژی‌هایی نظیر پردازش موازی (Parallel Processing)، مقیاس‌پذیری (Scaling) و موازی‌سازی داده‌ها آشنا می‌شوید. در ادامه، با هادوپ (Hadoop) آشنا می‌شوید؛ یک چارچوب متن‌باز که پردازش توزیع‌شده داده‌های حجیم را امکان‌پذیر می‌کند. شما کاربردهای حیاتی اکوسیستم هادوپ از جمله سیستم فایل توزیع‌شده (HDFS)، MapReduce و HBase را خواهید شناخت. همچنین با Hive، نرم‌افزار انبار داده که رابطی مشابه SQL برای پرس‌وجو و مدیریت بهینه مجموعه‌داده‌های بزرگ فراهم می‌کند، آشنا می‌شوید. سپس به بررسی Apache Spark خواهید پرداخت؛ موتور پردازشی متن‌باز که روش‌های نوین ذخیره‌سازی و استفاده از بیگ دیتا را ارائه می‌دهد. در این بخش یاد می‌گیرید چگونه از اسپارک برای استخراج تحلیل‌های قابل اطمینان استفاده کنید و با اجزای تشکیل‌دهنده این پلتفرم آشنا می‌شوید. شما مفاهیم DataFrames را یاد گرفته، عملیات پایه روی آن‌ها را اجرا کرده و با SparkSQL کار خواهید کرد. همچنین بررسی می‌کنید که اسپارک چگونه درخواست‌های برنامه شما را پردازش و نظارت می‌کند و چگونه می‌توانید از طریق Spark Application UI روند اجرای کارها را ردیابی کنید. این دوره شامل چندین آزمایشگاه عملی (Hands-on labs) است تا مفاهیم آموخته شده را پیاده‌سازی کنید. شما پروژه‌های هادوپ و اسپارک را با استفاده از ابزارهایی نظیر Docker، Kubernetes، Python و Jupyter Notebooks به اتمام خواهید رساند.

سرفصل ها و درس ها

بیگ دیتا چیست؟ What Is Big Data?

  • معرفی دوره Course Introduction

  • بیگ دیتا چیست؟ What is Big Data?

  • تاثیرات داده‌های عظیم Impact of Big Data

  • پردازش موازی، مقیاس‌پذیری و موازی‌سازی داده‌ها Parallel Processing, Scaling, and Data Parallelism

  • ابزارها و اکوسیستم بیگ دیتا Big Data Tools and Ecosystem

  • متن‌باز و داده‌های عظیم Open Source and Big Data

  • فراتر از تبلیغات Beyond the Hype

  • موارد کاربرد بیگ دیتا Big Data Use Cases

آشنایی با اکوسیستم هادوپ Introduction to the Hadoop Ecosystem

  • معرفی هادوپ Introduction to Hadoop

  • آشنایی با MapReduce Intro to MapReduce

  • اکوسیستم هادوپ Hadoop Ecosystem

  • سیستم فایل HDFS HDFS

  • آپاچی هایو (HIVE) HIVE

  • آپاچی اچ‌بیس (HBASE) HBASE

آپاچی اسپارک Apache Spark

  • چرا از آپاچی اسپارک استفاده کنیم؟ Why use Apache Spark?

  • مبانی برنامه‌نویسی تابعی Functional Programming Basics

  • برنامه‌نویسی موازی با استفاده از RDDها Parallel Programming using Resilient Distributed Datasets

  • مقیاس‌پذیری و موازی‌سازی داده‌ها در اسپارک Scale out / Data Parallelism in Apache Spark

  • دیتافریم‌ها و SparkSQL Dataframes and SparkSQL

دیتافریم‌ها و اسپارک اس‌کیوال DataFrames and Spark SQL

  • استفاده از RDD در برنامه‌نویسی موازی و اسپارک RDDs in Parallel Programming and Spark

  • دیتافریم‌ها و دیتاست‌ها Data-frames and Datasets

  • بررسی Catalyst و Tungsten Catalyst and Tungsten

  • فرآیند ETL با دیتافریم‌ها ETL with DataFrames

  • کاربردهای واقعی SparkSQL Real-world usage of SparkSQL

گزینه‌های محیط توسعه و زمان اجرا Development and Runtime Environment Options

  • معماری آپاچی اسپارک Apache Spark Architecture

  • بررسی حالت‌های کلاستر در آپاچی اسپارک Overview of Apache Spark Cluster Modes

  • نحوه اجرای یک برنامه آپاچی اسپارک How to Run an Apache Spark Application

  • استفاده از آپاچی اسپارک در IBM Cloud Using Apache Spark on IBM Cloud

  • تنظیمات پیکربندی آپاچی اسپارک Setting Apache Spark Configuration

  • اجرای اسپارک روی کوبرنتیز Running Spark on Kubernetes

مانیتورینگ و بهینه‌سازی Monitoring and Tuning

  • رابط کاربری (UI) آپاچی اسپارک The Apache Spark User Interface

  • مانیتورینگ پیشرفت برنامه Monitoring Application Progress

  • عیب‌یابی مشکلات برنامه‌های آپاچی اسپارک Debugging Apache Spark Application Issues

  • درک منابع حافظه (Memory) Understanding Memory Resources

  • درک منابع پردازنده (Processor) Understanding Processor Resources

پروژه نهایی و ارزیابی Final Project and Assessment

نمایش نظرات

آموزش جامع بیگ دیتا (Big Data) با اسپارک و هادوپ
جزییات دوره
19h 31m
35
(آخرین آپدیت)
76,342
4.3 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar