آموزش رسیدگی به داده های جریان با پایگاه داده لاجورد با استفاده از جریان ساختار یافته Spark - آخرین آپدیت

دانلود Handling Streaming Data with Azure Databricks Using Spark Structured Streaming

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: خطوط لوله داده مدرن اغلب شامل داده های جریان است که باید در زمان واقعی پردازش شوند. در یک سناریوی عملی ، از شما خواسته می شود با چندین جریان و مجموعه داده ها مقابله کنید تا به طور مداوم نتایج را تولید کنید. در این دوره ، دست زدن به داده های جریان با Databricks Azure با استفاده از جریان ساختار یافته Spark ، شما می آموزید که چگونه از جریان ساختار یافته Spark در پلت فرم Databricks استفاده کنید ، که روی مایکروسافت لاجورد است و از ویژگی های آن برای ساخت خطوط لوله جریان پایان به پایان استفاده می کند. ابتدا ، یک بازپرداخت سریع مدل پردازش جریان ساختار یافته Spark را مشاهده خواهید کرد. سناریویی را که ما پیاده سازی خواهیم کرد ، درک کنید و تنظیم محیط را تکمیل کنید. در مرحله بعد ، شما یاد می گیرید که چگونه منابع و سینک ها را پیکربندی کنید و هر مرحله از خط لوله جریان را بسازید - با استخراج داده ها از منابع مختلف ، تبدیل آن و بارگذاری آن به چندین سینک - لاجورد دریاچه ، قطب های رویداد لاجورد و Azure SQL. همچنین می توانید زمان های مختلف مرتبط با یک رویداد و نحوه جمع آوری داده ها را با استفاده از ویندوز مشاهده کنید. در مرحله بعد ، خواهید دید که چگونه یک جریان را با مجموعه داده های استاتیک یا تاریخی ترکیب کنید. و نحوه ترکیب چندین جریان با هم. سرانجام ، شما یاد خواهید گرفت که چگونه یک خط لوله آماده تولید را بسازید ، آن را به عنوان یک کار در Databricks برنامه ریزی کنید و آنها را با استفاده از Databricks CLI مدیریت کنید. پس از اتمام این دوره ، برای حل انواع مشکلات تجاری ، در ساخت خطوط لوله پیچیده ، در حال اجرا بر روی Databricks Azure ، راحت خواهید بود.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

تنظیم محیط زیست Setting up the Environment

  • طرح و پیش نیازهای دوره Course Outline and Prerequisites

  • recap سریع: جریان ساختار یافته جرقه Quick Recap: Spark Structured Streaming

  • سناریو پیاده روی Scenario Walkthrough

  • پیکربندی مراکز رویداد لاجورد به عنوان منبع Configuring Azure Event Hubs as Source

  • برنامه Setup Sample برای ارسال رویدادهای تاکسی NYC Setup Sample App to Send NYC Taxi Events

  • خلاصه Summary

ساخت خط لوله جریان Building Streaming Pipeline

  • استخراج و پردازش داده های منبع Extracting and Processing Source Data

  • اعمال تحولات Applying Transformations

  • بارگیری به پرونده ها Loading to Files

  • درک ضمانت نامه بازرسی و تحویل Understanding Checkpointing and Delivery Guarantees

  • بارگیری به مرکز رویداد لاجورد Loading to Azure Event Hub

  • بارگیری به پایگاه داده Azure SQL Loading to Azure SQL Database

  • خلاصه Summary

کار با Timestamps و ویندوز Working with Timestamps and Windows

  • رویدادها ، مصرف و پردازش زمان بندی Event, Ingestion, and Processing Timestamps

  • ویندوز در حال درک Understanding Windows

  • کار با ویندوز Working With Windows

  • خلاصه Summary

مدیریت عملیات های دولتی Handling Stateful Operations

  • درک مدیریت دولت Understanding State Management

  • رسیدگی به داده های دیر هنگام با استفاده از علامت گذاری Handling Late Data Using Watermarking

  • داده های پخش شده Deduplicating Streaming Data

  • خلاصه Summary

کار با چندین جریان و مجموعه داده Working with Multiple Streams and Datasets

  • پیوستن به جریان با داده های استاتیک Joining Stream with Static Data

  • ترکیب چندین جریان Combining Multiple Streams

  • رسیدگی به حالت در جریان جریان جریان Handling State in Stream-Stream Joins

  • خلاصه Summary

اجرای خط لوله جریان در تولید Running Streaming Pipeline in Production

  • پارامتر کردن خط لوله جریان Parameterize Streaming Pipeline

  • برنامه ریزی با مشاغل Databricks Scheduling with Databricks Jobs

  • محیط را با استفاده از Databricks CLI مدیریت کنید Manage Environment Using Databricks CLI

  • خلاصه Summary

نمایش نظرات

آموزش رسیدگی به داده های جریان با پایگاه داده لاجورد با استفاده از جریان ساختار یافته Spark
جزییات دوره
2h 28m
30
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
29
4.8 از 5
دارد
دارد
دارد
Mohit Batra
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mohit Batra Mohit Batra

موهیت یک مهندس داده ، یک مربی مجوز مایکروسافت (MCT) و یک مشاور است. موهیت دارای بیش از 15 سال تجربه گسترده در زمینه راهکارهای مقیاس بزرگ هوش تجاری ، ذخیره سازی داده ها و راه حل های بزرگ داده با شرکت هایی مانند مایکروسافت و برخی از بانک های پیشرو سرمایه گذاری است. موهیت به عنوان یک متخصص در زمینه خود ، اغلب دانش خود را در Azure ، Spark ، SQL Server و Power BI در تالارهای گفتگوی عمومی مختلف و به عنوان یک مربی شریک کرده است. محیط واقعاً عاشق تدریس است و از تولید مواد یادگیری جذاب و با کیفیت برای جلسات خود لذت می برد. در اوقات فراغت ، موهیت عاشق کتاب خواندن است ، از عکاسی و موسیقی لذت می برد.