آموزش پردازش داده های بدون سرور با جریان داده: توسعه خطوط لوله

Serverless Data Processing with Dataflow: Develop Pipelines

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: در این قسمت دوم از سری دوره های Dataflow، ما قصد داریم در توسعه خطوط لوله با استفاده از Beam SDK بیشتر غواصی کنیم. ما با بررسی مفاهیم پرتو آپاچی شروع می کنیم. در مرحله بعد، ما در مورد پردازش داده‌های جریان با استفاده از ویندوز بحث می‌کنیم،... در این قسمت دوم از سری دوره‌های Dataflow، می‌خواهیم در توسعه خطوط لوله با استفاده از Beam SDK بیشتر غواصی کنیم. ما با بررسی مفاهیم پرتو آپاچی شروع می کنیم. در مرحله بعد، در مورد پردازش داده های جریان با استفاده از پنجره ها، واترمارک ها و محرک ها بحث می کنیم. سپس گزینه‌هایی را برای منابع و سینک‌ها در خطوط لوله، طرح‌واره‌ها برای بیان داده‌های ساختاریافته و نحوه انجام تبدیل‌های حالت با استفاده از APIهای State و Timer پوشش می‌دهیم. ما به بررسی بهترین روش‌هایی می‌رویم که به حداکثر رساندن عملکرد خط لوله شما کمک می‌کنند. در پایان دوره، ما SQL و Dataframes را معرفی می کنیم تا منطق کسب و کار شما را در Beam و نحوه توسعه مکرر خطوط لوله با استفاده از نوت بوک های Beam را نشان دهیم.

سرفصل ها و درس ها

معرفی Introduction

  • معرفی دوره Course Introduction

بررسی مفاهیم پرتو Beam Concepts Review

  • مبانی پرتو Beam Basics

  • Utility Transforms Utility Transforms

  • چرخه حیات DoFn DoFn Lifecycle

  • شروع کار با GCP و Qwiklabs Getting Started With GCP And Qwiklabs

  • آزمایشگاه: Dataflow Academy (جاوا) - آزمایشگاه 1 - نوشتن خط لوله ETL با استفاده از پرتو Apache و Cloud Dataflow Lab: Dataflow Academy (Java) - Lab 1 - Writing an ETL pipeline using Apache Beam and Cloud Dataflow

  • آزمایشگاه: Dataflow Academy (Python) - آزمایشگاه 1 - نوشتن خط لوله ETL با استفاده از Apache Beam و Cloud Dataflow Lab: Dataflow Academy (Python) - Lab 1 - Writing an ETL pipeline using Apache Beam and Cloud Dataflow

  • منابع ماژول Module Resources

Windows, Watermarks Triggers Windows, Watermarks Triggers

  • پنجره ها Windows

  • متن Watermarks

  • محرک Triggers

  • آزمایشگاه: آکادمی DataFlow (جاوا) - آزمایشگاه 3 - خط لوله های تجزیه و تحلیل دسته ای با جریان داده ابر Lab: Dataflow Academy (Java) - Lab 3 - Batch Analytics Pipelines with Cloud Dataflow

  • آزمایشگاه: Dataflow Academy (Python) - Lab 3 - Batch Analytics Pipelines with Cloud Dataflow Lab: Dataflow Academy (Python) - Lab 3 - Batch Analytics Pipelines with Cloud Dataflow

  • آزمایشگاه: Dataflow Academy (Java) - Lab 5 - Streaming Analytics Pipeline با Cloud Dataflow Lab: Dataflow Academy (Java) - Lab 5 - Streaming Analytics Pipeline with Cloud Dataflow

  • Lab: Dataflow Academy (Python) - Lab 5 - Streaming Analytics Pipeline با Cloud Dataflow Lab: Dataflow Academy (Python) - Lab 5 - Streaming Analytics Pipeline with Cloud Dataflow

  • منابع ماژول Module Resources

منابع و سینک ها Sources & Sinks

  • منابع سینک Sources & Sinks

  • متن io پرونده io Text IO & File IO

  • BigQuery IO BigQuery IO

  • PubSub IO PubSub IO

  • کافکا آی او Kafka IO

  • BigTable IO BigTable IO

  • Avro IO Avro IO

  • DoFn قابل تقسیم Splittable DoFn

  • منابع ماژول Module Resources

طرحواره ها Schemas

  • طرحواره های پرتو Beam schemas

  • نمونه های کد Code examples

  • آزمایشگاه: Dataflow Academy (Java) - Lab 2 - Branching Pipelines Lab: Dataflow Academy (Java) - Lab 2 - Branching Pipelines

  • آزمایشگاه: Dataflow Academy (Python) - Lab 2 - Branching Pipelines Lab: Dataflow Academy (Python) - Lab 2 - Branching Pipelines

  • منابع ماژول Module Resources

حالت و تایمرها State and Timers

  • API حالت State API

  • تایمر API Timer API

  • خلاصه Summary

  • منابع ماژول Module Resources

بهترین شیوه ها Best Practices

  • طرحواره ها Schemas

  • مدیریت داده های غیر قابل پردازش Handling un-processable data

  • رسیدگی به خطا Error handling

  • تولید کننده کد AutoValue AutoValue code generator

  • مدیریت داده های JSON JSON data handling

  • از چرخه عمر DoFn استفاده کنید Utilize DoFn lifecycle

  • بهینه سازی خطوط لوله Pipeline Optimizations

  • آزمایشگاه: Dataflow Academy (Java) - Lab 7 - Advanced Streaming Analytics Pipeline با Cloud Dataflow Lab: Dataflow Academy (Java) - Lab 7 - Advanced Streaming Analytics Pipeline with Cloud Dataflow

  • آزمایشگاه: Dataflow Academy (Python) - Lab 7 - Advanced Streaming Analytics Pipeline با Cloud Dataflow Lab: Dataflow Academy (Python) - Lab 7 - Advanced Streaming Analytics Pipeline with Cloud Dataflow

  • منابع ماژول Module Resources

Dataflow SQL و DataFrames Dataflow SQL & DataFrames

  • Dataflow و Beam SQL Dataflow and Beam SQL

  • ویندوز در SQL Windowing in SQL

  • Beam DataFrames Beam DataFrames

  • آزمایشگاه: Dataflow Academy (Java) - Lab 4 - SQL Batch Analytics Pipelines with Cloud Dataflow Lab: Dataflow Academy (Java) - Lab 4 - SQL Batch Analytics Pipelines with Cloud Dataflow

  • آزمایشگاه: Dataflow Academy (Python) - Lab 4 - SQL Batch Analytics Pipelines with Cloud Dataflow Lab: Dataflow Academy (Python) - Lab 4 - SQL Batch Analytics Pipelines with Cloud Dataflow

  • آزمایشگاه: آکادمی DataFlow (Java) - آزمایشگاه 6 - با استفاده از DataFlow SQL برای تجزیه و تحلیل جریان Lab: Dataflow Academy (Java) - Lab 6 - Using Dataflow SQL for Streaming Analytics

  • آزمایشگاه: Dataflow Academy (Python) - آزمایشگاه 6 - استفاده از Dataflow SQL برای تحلیل جریانی Lab: Dataflow Academy (Python) - Lab 6 - Using Dataflow SQL for Streaming Analytics

  • منابع ماژول Module Resources

نوت بوک پرتو Beam Notebooks

  • نوت بوک پرتو Beam Notebooks

  • منابع ماژول Module Resources

خلاصه Summary

  • خلاصه دوره Course Summary

نمایش نظرات

نظری ارسال نشده است.

آموزش پردازش داده های بدون سرور با جریان داده: توسعه خطوط لوله
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
1h 58m
55
Pluralsight (پلورال سایت) pluralsight-small
07 اردیبهشت 1400 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
از 5
دارد
دارد
دارد
Google Cloud

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Google Cloud Google Cloud

ایجاد تحول دیجیتال با آموزش درخواستی

Google Cloud آموزش و گواهینامه های درخواستی را در فناوری های ابری در حال ظهور ارائه می دهد.

Google Cloud با صدها آزمایشگاه، دوره و نشان مهارت، متخصصان را قادر می‌سازد تا مهارت‌های ابری حیاتی را با سرعت خودشان ایجاد کنند. آزمایشگاه‌های عملی این شرکت اعتبارنامه‌های موقتی را به منابع واقعی ابر ارائه می‌دهند، بنابراین افراد می‌توانند Google Cloud را با استفاده از چیز واقعی یاد بگیرند. فراگیران همچنین می توانند با کسب گواهینامه های Google Cloud و/یا نشان های مهارتی که می توانند با شبکه خود به اشتراک بگذارند، تخصص خود را تأیید کنند.

در وب‌سایت رسمی Google Cloud بیشتر بیاموزید.

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.