آموزش Apache Spark: مهندسی داده های بزرگ

Apache Spark Essential Training: Big Data Engineering

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: به منظور ساخت خطوط لوله و شبکه هایی که داده ها را جریان ، پردازش و ذخیره می کنند ، مهندسان داده و متخصصان علوم داده DevOps باید نحوه ترکیب چندین فناوری بزرگ داده را درک کنند. در این دوره ، نحوه ایجاد خطوط لوله انتقال داده بزرگ در اطراف Apache Spark را کشف کنید. با Kumaran Ponnambalam همراه باشید تا او شما را در چگونگی ایجاد Apache Spark با سایر فن آوری های داده بزرگ راهنمایی کند. وی اصول Apache Kafka Connect و چگونگی ادغام آن با Spark را برای پخش در زمان واقعی ارائه می دهد. علاوه بر این ، او نشان می دهد که چگونه می توان از فن آوری های مختلف برای ساخت یک پروژه پایان به پایان استفاده کرد که یک مشکل تجاری در دنیای واقعی را حل می کند.
موضوعات شامل:
  • مهندسی داده چیست؟
  • اسپارک و کافکا برای مهندسی داده
  • انتقال داده با کافکا و کافکا کانکت
  • ادغام کافکا با Apache Spark
  • نحوه کار اسپارک
  • بهینه سازی برای ارزیابی تنبلی
  • باتری های پیچیده

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • فایل های تمرینی Exercise files

  • محیط را تنظیم کنید Set up the environment

1. نمای کلی مهندسی داده 1. Data Engineering Overview

  • مهندسی داده چیست؟ What is data engineering?

  • مراحل مهندسی داده Stages of data engineering

  • مهندسی داده با داده های بزرگ به چالش می کشد Data engineering challenges with big data

  • جرقه و کافکا برای مهندسی داده Spark and Kafka for data engineering

2. انتقال داده ها با کافکا 2. Moving Data with Kafka

  • از کانکتورهای کافکا استفاده کنید Use Kafka connectors

  • کد: به یک منبع پرونده بخوانید Code: Read to a file source

  • کد: برای سینک HDFS بنویسید Code: Write to a HDFS sink

  • کد: برای منبع JDBC بخوانید Code: Read for a JDBC source

  • کد: به یک سینک جرقه بنویسید Code: Write to a Spark sink

3. جرقه پردازش با کارایی بالا 3. Spark High-Performance Processing

  • مهندسی داده با جرقه Data engineering with Spark

  • جرقه چگونه کار می کند How Spark works

  • برای ارزیابی تنبل بهینه سازی کنید Optimize for lazy evaluation

  • با وابستگی ها کار کنید Work with dependencies

  • باتری های پیچیده Complex accumulators

4- از Project Case استفاده کنید 4. Use Case Project

  • بیان مسأله Problem statement

  • بررسی اجمالی راه حل Solution overview

  • داده های فروش ایالات متحده را پردازش کنید Process US sales data

  • داده های فروش اتحادیه اروپا را پردازش کنید Process EU sales data

  • پردازش وب به داده ها ضربه می زند Process web hits data

  • پردازش داده های صدای جیر جیر Process tweet data

  • مقیاس راه حل Scale the solution

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش Apache Spark: مهندسی داده های بزرگ
جزییات دوره
1h 40m
26
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
66,827
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kumaran Ponnambalam Kumaran Ponnambalam

اختصاص به آموزش علوم داده

V2 Maestros به آموزش علوم داده و داده های بزرگ با هزینه های مقرون به صرفه برای جهان اختصاص دارد. مربیان ما تجربه دنیای واقعی در تمرین علم داده و ارائه نتایج تجاری دارند. علم داده یک حوزه داغ و در حال رخ دادن در صنعت فناوری اطلاعات است. متأسفانه منابع موجود برای یادگیری این مهارت به سختی یافت می شود و گران است. امیدواریم این مشکل را با ارائه آموزش باکیفیت با نرخ های مقرون به صرفه، با ایجاد استعدادهای علم داده در سراسر جهان، کاهش دهیم.