آموزش رسیدگی به داده های جریان با پایگاه داده لاجورد با استفاده از جریان ساختار یافته Spark

دانلود Handling Streaming Data with Azure Databricks Using Spark Structured Streaming

در حال بارگزاری نمونه ویدیو، لطفا صبر کنید...
Video Player is loading.
Current Time 0:00
Duration 0:00
Loaded: 0%
Stream Type LIVE
Remaining Time 0:00
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles off, selected
      نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
      نمونه ویدیوها:
      • در حال بارگزاری، لطفا صبر کنید...
      توضیحات دوره: خطوط لوله داده مدرن اغلب شامل داده های جریان است که باید در زمان واقعی پردازش شوند. در یک سناریوی عملی ، از شما خواسته می شود با چندین جریان و مجموعه داده ها مقابله کنید تا به طور مداوم نتایج را تولید کنید. در این دوره ، دست زدن به داده های جریان با Databricks Azure با استفاده از جریان ساختار یافته Spark ، شما می آموزید که چگونه از جریان ساختار یافته Spark در پلت فرم Databricks استفاده کنید ، که روی مایکروسافت لاجورد است و از ویژگی های آن برای ساخت خطوط لوله جریان پایان به پایان استفاده می کند. ابتدا ، یک بازپرداخت سریع مدل پردازش جریان ساختار یافته Spark را مشاهده خواهید کرد. سناریویی را که ما پیاده سازی خواهیم کرد ، درک کنید و تنظیم محیط را تکمیل کنید. در مرحله بعد ، شما یاد می گیرید که چگونه منابع و سینک ها را پیکربندی کنید و هر مرحله از خط لوله جریان را بسازید - با استخراج داده ها از منابع مختلف ، تبدیل آن و بارگذاری آن به چندین سینک - لاجورد دریاچه ، قطب های رویداد لاجورد و Azure SQL. همچنین می توانید زمان های مختلف مرتبط با یک رویداد و نحوه جمع آوری داده ها را با استفاده از ویندوز مشاهده کنید. در مرحله بعد ، خواهید دید که چگونه یک جریان را با مجموعه داده های استاتیک یا تاریخی ترکیب کنید. و نحوه ترکیب چندین جریان با هم. سرانجام ، شما یاد خواهید گرفت که چگونه یک خط لوله آماده تولید را بسازید ، آن را به عنوان یک کار در Databricks برنامه ریزی کنید و آنها را با استفاده از Databricks CLI مدیریت کنید. پس از اتمام این دوره ، برای حل انواع مشکلات تجاری ، در ساخت خطوط لوله پیچیده ، در حال اجرا بر روی Databricks Azure ، راحت خواهید بود.

      سرفصل ها و درس ها

      بررسی اجمالی دوره Course Overview

      • بررسی اجمالی دوره Course Overview

      تنظیم محیط زیست Setting up the Environment

      • طرح و پیش نیازهای دوره Course Outline and Prerequisites

      • recap سریع: جریان ساختار یافته جرقه Quick Recap: Spark Structured Streaming

      • سناریو پیاده روی Scenario Walkthrough

      • پیکربندی مراکز رویداد لاجورد به عنوان منبع Configuring Azure Event Hubs as Source

      • برنامه Setup Sample برای ارسال رویدادهای تاکسی NYC Setup Sample App to Send NYC Taxi Events

      • خلاصه Summary

      ساخت خط لوله جریان Building Streaming Pipeline

      • استخراج و پردازش داده های منبع Extracting and Processing Source Data

      • اعمال تحولات Applying Transformations

      • بارگیری به پرونده ها Loading to Files

      • درک ضمانت نامه بازرسی و تحویل Understanding Checkpointing and Delivery Guarantees

      • بارگیری به مرکز رویداد لاجورد Loading to Azure Event Hub

      • بارگیری به پایگاه داده Azure SQL Loading to Azure SQL Database

      • خلاصه Summary

      کار با Timestamps و ویندوز Working with Timestamps and Windows

      • رویدادها ، مصرف و پردازش زمان بندی Event, Ingestion, and Processing Timestamps

      • ویندوز در حال درک Understanding Windows

      • کار با ویندوز Working With Windows

      • خلاصه Summary

      مدیریت عملیات های دولتی Handling Stateful Operations

      • درک مدیریت دولت Understanding State Management

      • رسیدگی به داده های دیر هنگام با استفاده از علامت گذاری Handling Late Data Using Watermarking

      • داده های پخش شده Deduplicating Streaming Data

      • خلاصه Summary

      کار با چندین جریان و مجموعه داده Working with Multiple Streams and Datasets

      • پیوستن به جریان با داده های استاتیک Joining Stream with Static Data

      • ترکیب چندین جریان Combining Multiple Streams

      • رسیدگی به حالت در جریان جریان جریان Handling State in Stream-Stream Joins

      • خلاصه Summary

      اجرای خط لوله جریان در تولید Running Streaming Pipeline in Production

      • پارامتر کردن خط لوله جریان Parameterize Streaming Pipeline

      • برنامه ریزی با مشاغل Databricks Scheduling with Databricks Jobs

      • محیط را با استفاده از Databricks CLI مدیریت کنید Manage Environment Using Databricks CLI

      • خلاصه Summary

      نمایش نظرات

      نظری ارسال نشده است.

      آموزش رسیدگی به داده های جریان با پایگاه داده لاجورد با استفاده از جریان ساختار یافته Spark
      خرید اشتراک و دانلودخرید تکی و دانلود | 210,000 تومان (5 روز مهلت دانلود ) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 2 تا 14 ساعت می باشد.
      جزییات دوره
      2h 28m
      30
      Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
      (آخرین آپدیت)
      29
      4.8 از 5
      دارد
      دارد
      دارد
      Mohit Batra
      جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

      Google Chrome Browser

      Internet Download Manager

      Pot Player

      Winrar

      Mohit Batra Mohit Batra

      موهیت یک مهندس داده ، یک مربی مجوز مایکروسافت (MCT) و یک مشاور است. موهیت دارای بیش از 15 سال تجربه گسترده در زمینه راهکارهای مقیاس بزرگ هوش تجاری ، ذخیره سازی داده ها و راه حل های بزرگ داده با شرکت هایی مانند مایکروسافت و برخی از بانک های پیشرو سرمایه گذاری است. موهیت به عنوان یک متخصص در زمینه خود ، اغلب دانش خود را در Azure ، Spark ، SQL Server و Power BI در تالارهای گفتگوی عمومی مختلف و به عنوان یک مربی شریک کرده است. محیط واقعاً عاشق تدریس است و از تولید مواد یادگیری جذاب و با کیفیت برای جلسات خود لذت می برد. در اوقات فراغت ، موهیت عاشق کتاب خواندن است ، از عکاسی و موسیقی لذت می برد.