آموزش پردازش داده‌های بدون سرور با Dataflow: توسعه خط لوله‌های داده (Pipelines) - آخرین آپدیت

دانلود Serverless Data Processing with Dataflow: Develop Pipelines

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: در این بخش دوم از مجموعه دوره‌های Dataflow، به بررسی عمیق‌تر توسعه خط لوله‌های داده با استفاده از Beam SDK می‌پردازیم. ابتدا مفاهیم Apache Beam را مرور می‌کنیم. سپس، پردازش داده‌های استریمینگ (Streaming) را با استفاده از پنجره‌ها (Windows)، واترمارک‌ها (Watermarks) و تریگرها (Triggers) بررسی خواهیم کرد. در ادامه، گزینه‌های مربوط به منابع ورودی (Sources) و خروجی (Sinks)، شماهایی برای نمایش داده‌های ساختاریافته و نحوه انجام تغییرات حالت‌مند (Stateful Transformations) با استفاده از APIهای State و Timer را می‌آموزیم. همچنین بهترین روش‌ها (Best Practices) برای بهینه‌سازی حداکثری عملکرد خط لوله را مرور می‌کنیم. در پایان دوره، با SQL و Dataframes برای پیاده‌سازی منطق تجاری در Beam و نحوه توسعه تکرارشونده خط لوله‌ها با استفاده از Beam Notebooks آشنا خواهید شد.

سرفصل ها و درس ها

مقدمه Introduction

  • معرفی دوره Course Introduction

مرور مفاهیم Beam Beam Concepts Review

  • مبانی Beam Beam Basics

  • تبدیل‌های کاربردی (Utility Transforms) Utility Transforms

  • چرخه حیات DoFn DoFn Lifecycle

پنجره‌ها، واترمارک‌ها و تریگرها Windows, Watermarks, and Triggers

  • پنجره‌ها (Windows) Windows

  • واترمارک‌ها (Watermarks) Watermarks

  • تریگرها (Triggers) Triggers

منابع ورودی و خروجی (Sources & Sinks) Sources & Sinks

  • منابع ورودی و خروجی Sources & Sinks

  • TextIO و FileIO TextIO & FileIO

  • BigQueryIO BigQueryIO

  • PubsubIO PubsubIO

  • KafkaIO KafkaIO

  • BigtableIO BigtableIO

  • AvroIO AvroIO

  • توابع DoFn قابل تقسیم Splittable DoFn

شماها (Schemas) Schemas

  • شماهای Beam Beam schemas

  • مثال‌های کدنویسی Code examples

حالت‌ها و تایمرها (State and Timers) State and Timers

  • رابط State API State API

  • رابط Timer API Timer API

  • جمع‌بندی Summary

بهترین روش‌های بهینه‌سازی Best Practices

  • شماها (Schemas) Schemas

  • مدیریت داده‌های غیرقابل پردازش Handling un-processable data

  • مدیریت خطاها Error handling

  • تولیدکننده کد AutoValue AutoValue code generator

  • مدیریت داده‌های JSON JSON data handling

  • بهره‌گیری از چرخه حیات DoFn Utilize DoFn lifecycle

  • بهینه‌سازی خط لوله (Pipeline) Pipeline Optimizations

دیتافلو SQL و DataFrames Dataflow SQL & DataFrames

  • دیتافلو و Beam SQL Dataflow and Beam SQL

  • پنجره‌بندی در SQL Windowing in SQL

  • دیتا‌فریم‌های Beam Beam DataFrames

دفترچه‌های Beam Notebooks Beam Notebooks

  • دفترچه‌های Beam Notebooks Beam Notebooks

جمع‌بندی Summary

  • جمع‌بندی نهایی دوره Course Summary

نمایش نظرات

آموزش پردازش داده‌های بدون سرور با Dataflow: توسعه خط لوله‌های داده (Pipelines)
جزییات دوره
23h 24m
32
(آخرین آپدیت)
4,586
3.1 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar