آموزش مدیریت سریع داده ها با Apache Spark SQL و پخش جریانی

Handling Fast Data with Apache Spark SQL and Streaming

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: Apache Spark پیشرو در زمینه پردازش سریع و کارآمد داده است. این دوره به شما نحوه استفاده از SQL ، Streaming و حتی جدیدترین API های Struktur Streaming برای ایجاد برنامه هایی با قابلیت کنترل داده ها هنگام ورود را آموزش می دهد. تجزیه و تحلیل داده ها قبلاً کاری بود که شما هر شب انجام می دادید. اکنون شما باید قادر به پردازش داده ها در هنگام پرواز باشید تا بتوانید اطلاعات بصورت دقیقه ای را ارائه دهید. اما ، آنچه را که ساعتها بدون پایگاه کد پیچیده انجام می شد ، در زمان واقعی چگونه انجام می دهید؟ در این دوره ، مدیریت سریع داده ها با Apache Spark SQL و جریان ، خواهید آموخت که از Apache Spark Streaming و کتابخانه های SQL به عنوان یک روش عالی برای مدیریت این دنیای جدید در زمان واقعی ، پردازش سریع داده استفاده کنید. ابتدا وارد SparkSQL می شوید. در مرحله بعدی ، نحوه دستیابی به کلاهبرداری احتمالی را با تجزیه و تحلیل جریان ها با Spark Streaming کشف خواهید کرد. سرانجام ، شما API جدیدتر Structured Streaming را کشف خواهید کرد. با پایان این دوره ، شما درک عمیق تری از این API ها ، همراه با تعدادی از مفاهیم جریان دهنده که طراحی API را هدایت کرده اند ، خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

مقدمه Introduction

  • مقدمه Introduction

  • داده های سریع: اجتناب از پیچیدگی معماری Lambda Fast Data: Avoiding Lambda Architecture Complexity

  • چه چیزی انتظار می رود What to Expect

  • جرقه 2.x Spark 2.x

  • منابع Resources

  • خلاصه Summary

پرس و جو از داده ها با DataFrames (بخش 1) Querying Data with the DataFrames (Part 1)

  • مقدمه Introduction

  • Spark SQL FTW Spark SQL FTW

  • جستجو در API DataFrame Digging into the DataFrame API

  • مرور بقیه API DataFrame Reviewing the Rest of the DataFrame API

  • سerال کردن با SQL Querying with SQL

  • گسترش سerال از طریق توابع Extending Querying via Functions

  • صاف کردن داده ها با انفجار Flattening Data with Explode

  • کار با ویندوز Working with Windows

پرس و جو از داده ها با DataFrames (بخش 2) Querying Data with the DataFrames (Part 2)

  • مقدمه Introduction

  • کار با ویندوز Working with Windows

  • توابع ، توابع ... Functions, Functions...

  • و توابع بیشتر And More Functions

  • هنوز عملکرد کافی نیست؟ توابع تعریف شده توسط کاربر Still Not Enough Functions? User Defined Functions

  • درک پیوستن Understanding Joins

  • مانیتورینگ پیشرفته SQL با Spark UI Advanced SQL Monitoring with the Spark UI

  • منابع Resources

  • خلاصه Summary

بهبود ایمنی نوع با مجموعه داده ها Improving Type Safety with Datasets

  • مقدمه Introduction

  • چرا نه فقط DataFrames؟ Why Not Just DataFrames?

  • اضافه کردن نوع ایمنی با مجموعه داده ها Adding Type Safety with Datasets

  • حتی تجمع هم می تواند از نظر نوع ایمن باشد Even Aggregation Can Be Type Safe

  • جستجو در مجموعه داده ها Digging into Datasets

  • با مجموعه داده ها می پیوندد Joins with Datasets

  • فراتر از پایگاه داده بومی با کاساندرا Beyond Native Datasources with Cassandra

  • منابع بیشتر More Datasources

  • منابع Resources

  • خلاصه Summary

پردازش داده ها با API جریان Processing Data with the Streaming API

  • مقدمه Introduction

  • چشم انداز جریان The Streaming Landscape

  • معرفی کافکا Introducing Kafka

  • درک مکانیک Spark Streaming Understanding Spark Streaming's Mechanics

  • پخش جریانی در عمل Streaming in Action

  • موارد بیشتر از Streaming API More of the Streaming API

  • API "RDD" DStream The DStream 'RDD' API

  • درباره پخش جریانی مفید: Windows و Checkpoint About Stateful Streaming: Windows and Checkpoints

  • استفاده از حالت برای کشف سریع تقلب Utilizing State for Speedy Fraud Detection

  • جریان بهبود یافته از طریق mapWithState An Improved Stateful Stream via mapWithState

  • رابط کاربری Streaming The Streaming UI

  • منابع Resources

  • خلاصه Summary

بهینه سازی ، جریان ساختاری و Spark 2.x Optimizing, Structured Streaming, and Spark 2.x

  • مقدمه Introduction

  • افزایش انعطاف پذیری جریان Increasing Stream Resiliency

  • بهینه سازی برای افزایش عملکرد: پخش جریانی Optimizing to Boost Performance: Streaming

  • بهینه سازی برای افزایش عملکرد: SQL Optimizing to Boost Performance: SQL

  • مقدمه ای بر جریان سازه ای Introduction to Structured Streaming

  • شیرجه رفتن عمیق تر به جریان ساختار یافته A Deeper Dive into Structured Streaming

  • جریان ساختاری: علامت های آبی و مدل های خروجی Structured Streaming: Watermarks and Output Models

  • نسخه ی نمایشی جریان یافته ساختاریافته Structured Streaming Demo

  • آینده: جرقه 2.x The Future: Spark 2.x

  • منابع Resources

  • خلاصه Summary

نمایش نظرات

آموزش مدیریت سریع داده ها با Apache Spark SQL و پخش جریانی
جزییات دوره
4h 34m
58
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
29
3.6 از 5
دارد
دارد
دارد
Justin Pihony
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Justin Pihony Justin Pihony

جاستین یک مسافر نرم افزار است ، که به طور مداوم مهارت های خود را یاد می گیرد و عالی می کند. بیشتر اوایل کار حرفه ای او در C # و MSSQL بود ، اما او عاشق یادگیری زبانهای مختلف ، به ویژه Scala است. این علاقه به اسکالا باعث شد تا او به تیم لایتبند (Typesafe سابق) بپیوندد و حتی بیشتر در عمق کره زمین اسکالا فرو رود. و همانطور که دوست دارد یاد بگیرد ، دوست دارد دانش خود را از طریق آموزش و کمک به دیگران گسترش دهد. او یک پاسخ دهنده بسیار فعال در StackOverflow است و هم جلسات پیتزبورگ اسکالا و نهار ناهار خوری پیتسبورگ را برگزار می کند (یک جلسه ناهار نیمه منظم با محوریت فروشگاه گفتگو).