آموزش ساخت خطوط لوله داده دسته ای در GCP

Building Batch Data Pipelines on GCP

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: خطوط لوله داده معمولاً تحت یکی از پارادایم های Extra-Load، Extract-Load-Transform یا Extract-Transform-Load قرار می گیرند. این دوره توضیح می دهد که کدام پارادایم و چه زمانی باید برای داده های دسته ای استفاده شود. علاوه بر این، این دوره چندین فناوری را در Google Cloud Platform برای تبدیل داده ها از جمله BigQuery، اجرای Spark در Cloud Dataproc، نمودارهای خط لوله در Cloud Data Fusion و پردازش داده های بدون سرور با Cloud Dataflow را پوشش می دهد. یادگیرندگان تجربه عملی در ساخت اجزای خط لوله داده در پلتفرم Google Cloud با استفاده از QwikLabs خواهند داشت.

سرفصل ها و درس ها

معرفی Introduction

  • معرفی دوره Course Introduction

  • معرفی دوره Course Introduction

  • شروع کار با GCP و Qwiklabs Getting started with GCP and Qwiklabs

  • شروع کار با GCP و Qwiklabs Getting started with GCP and Qwiklabs

مقدمه ای بر خطوط لوله داده دسته ای Introduction to Batch Data Pipelines

  • EL، ELT، ETL EL, ELT, ETL

  • EL، ELT، ETL EL, ELT, ETL

  • ملاحظات کیفیت Quality considerations

  • ملاحظات کیفیت Quality considerations

  • نحوه انجام عملیات در BigQuery How to carry out operations in BigQuery

  • نحوه انجام عملیات در BigQuery How to carry out operations in BigQuery

  • کاستی ها Shortcomings

  • کاستی ها Shortcomings

  • ETL برای حل مشکلات کیفیت داده ها ETL to solve data quality issues

  • ETL برای حل مشکلات کیفیت داده ها ETL to solve data quality issues

اجرای Spark در Cloud Dataproc Executing Spark on Cloud Dataproc

  • اکوسیستم هادوپ The Hadoop ecosystem

  • اکوسیستم هادوپ The Hadoop ecosystem

  • اجرای Hadoop در Cloud Dataproc Running Hadoop on Cloud Dataproc

  • اجرای Hadoop در Cloud Dataproc Running Hadoop on Cloud Dataproc

  • GCS به جای HDFS GCS instead of HDFS

  • GCS به جای HDFS GCS instead of HDFS

  • بهینه سازی Dataproc Optimizing Dataproc

  • بهینه سازی Dataproc Optimizing Dataproc

  • بهینه سازی ذخیره سازی Dataproc Optimizing Dataproc Storage

  • بهینه سازی ذخیره سازی Dataproc Optimizing Dataproc Storage

  • بهینه سازی الگوهای Dataproc و مقیاس خودکار Optimizing Dataproc Templates and Autoscaling

  • بهینه سازی الگوهای Dataproc و مقیاس خودکار Optimizing Dataproc Templates and Autoscaling

  • بهینه سازی مانیتورینگ Dataproc Optimizing Dataproc Monitoring

  • بهینه سازی مانیتورینگ Dataproc Optimizing Dataproc Monitoring

  • معرفی آزمایشگاه: اجرای کارهای Apache Spark در Cloud Dataproc Lab Intro:Running Apache Spark jobs on Cloud Dataproc

  • معرفی آزمایشگاه: اجرای کارهای Apache Spark در Cloud Dataproc Lab Intro:Running Apache Spark jobs on Cloud Dataproc

  • آزمایشگاه: اجرای کارهای Apache Spark در Cloud Dataproc Lab: Running Apache Spark jobs on Cloud Dataproc

  • آزمایشگاه: اجرای کارهای Apache Spark در Cloud Dataproc Lab: Running Apache Spark jobs on Cloud Dataproc

  • خلاصه Summary

  • خلاصه Summary

خطوط لوله داده را با Cloud Data Fusion و Cloud Composer مدیریت کنید Manage Data Pipelines with Cloud Data Fusion and Cloud Composer

  • معرفی Introduction

  • معرفی Introduction

  • اجزای ترکیب داده ها Components of Data Fusion

  • اجزای ترکیب داده ها Components of Data Fusion

  • ساخت خط لوله Building a Pipeline

  • ساخت خط لوله Building a Pipeline

  • کاوش داده ها با استفاده از رانگلر Exploring Data using Wrangler

  • کاوش داده ها با استفاده از رانگلر Exploring Data using Wrangler

  • آزمایشگاه: ساخت و اجرای نمودار خط لوله در Cloud Data Fusion Lab:Building and executing a pipeline graph in Cloud Data Fusion

  • آزمایشگاه: ساخت و اجرای نمودار خط لوله در Cloud Data Fusion Lab:Building and executing a pipeline graph in Cloud Data Fusion

  • آزمایشگاه: ساخت و اجرای نمودار خط لوله با ترکیب داده ها Lab: Building and Executing a Pipeline Graph with Data Fusion

  • آزمایشگاه: ساخت و اجرای نمودار خط لوله با ترکیب داده ها Lab: Building and Executing a Pipeline Graph with Data Fusion

  • هماهنگ کردن کار بین سرویس های GCP با Cloud Composer Orchestrating work between GCP services with Cloud Composer

  • هماهنگ کردن کار بین سرویس های GCP با Cloud Composer Orchestrating work between GCP services with Cloud Composer

  • محیط جریان هوای آپاچی Apache Airflow Environment

  • محیط جریان هوای آپاچی Apache Airflow Environment

  • DAG ها و اپراتورها DAGs and Operators

  • DAG ها و اپراتورها DAGs and Operators

  • برنامه ریزی گردش کار Workflow scheduling

  • برنامه ریزی گردش کار Workflow scheduling

  • نظارت و ثبت Monitoring and Logging

  • نظارت و ثبت Monitoring and Logging

  • Lab:An Introduction to Cloud Composer Lab:An Introduction to Cloud Composer

  • Lab:An Introduction to Cloud Composer Lab:An Introduction to Cloud Composer

  • آزمایشگاه: مقدمه ای بر Cloud Composer Lab: An Introduction to Cloud Composer

  • آزمایشگاه: مقدمه ای بر Cloud Composer Lab: An Introduction to Cloud Composer

پردازش داده های بدون سرور با Cloud Dataflow Serverless Data Processing with Cloud Dataflow

  • Cloud Dataflow Cloud Dataflow

  • Cloud Dataflow Cloud Dataflow

  • چرا مشتریان برای Dataflow ارزش قائل هستند؟ Why customers value Dataflow

  • چرا مشتریان برای Dataflow ارزش قائل هستند؟ Why customers value Dataflow

  • ساخت خطوط لوله داده های ابری در کد Building Cloud Dataflow Pipelines in code

  • ساخت خطوط لوله داده های ابری در کد Building Cloud Dataflow Pipelines in code

  • ملاحظات کلیدی در طراحی خطوط لوله Key considerations with designing pipelines

  • ملاحظات کلیدی در طراحی خطوط لوله Key considerations with designing pipelines

  • تبدیل داده ها با PTtransforms Transforming data with PTransforms

  • تبدیل داده ها با PTtransforms Transforming data with PTransforms

  • آزمایشگاه: ساخت یک خط لوله جریان داده ساده Lab:Building a Simple Dataflow Pipeline

  • آزمایشگاه: ساخت یک خط لوله جریان داده ساده Lab:Building a Simple Dataflow Pipeline

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: خط لوله ساده جریان داده (جاوا) Lab: Serverless Data Analysis with Dataflow: A Simple Dataflow Pipeline (Java)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: خط لوله ساده جریان داده (جاوا) Lab: Serverless Data Analysis with Dataflow: A Simple Dataflow Pipeline (Java)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: خط لوله ساده جریان داده (پایتون) Lab: Serverless Data Analysis with Dataflow: A Simple Dataflow Pipeline (Python)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: خط لوله ساده جریان داده (پایتون) Lab: Serverless Data Analysis with Dataflow: A Simple Dataflow Pipeline (Python)

  • جمع شدن با GroupByKey و Combine Aggregating with GroupByKey and Combine

  • جمع شدن با GroupByKey و Combine Aggregating with GroupByKey and Combine

  • آزمایشگاه:MapReduce در Cloud Dataflow Lab:MapReduce in Cloud Dataflow

  • آزمایشگاه:MapReduce در Cloud Dataflow Lab:MapReduce in Cloud Dataflow

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: MapReduce در جریان داده (جاوا) Lab: Serverless Data Analysis with Dataflow : MapReduce in Dataflow (Java)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: MapReduce در جریان داده (جاوا) Lab: Serverless Data Analysis with Dataflow : MapReduce in Dataflow (Java)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با Dataflow: MapReduce در Dataflow (Python) Lab: Serverless Data Analysis with Dataflow: MapReduce in Dataflow (Python)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با Dataflow: MapReduce در Dataflow (Python) Lab: Serverless Data Analysis with Dataflow: MapReduce in Dataflow (Python)

  • ورودی های جانبی و ویندوز داده ها Side Inputs and Windows of data

  • ورودی های جانبی و ویندوز داده ها Side Inputs and Windows of data

  • آزمایشگاه: تمرین ورودی های جانبی خط لوله Lab:Practicing Pipeline Side Inputs

  • آزمایشگاه: تمرین ورودی های جانبی خط لوله Lab:Practicing Pipeline Side Inputs

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: ورودی های جانبی (پایتون) Lab: Serverless Data Analysis with Dataflow: Side Inputs (Python)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: ورودی های جانبی (پایتون) Lab: Serverless Data Analysis with Dataflow: Side Inputs (Python)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: ورودی های جانبی (جاوا) Lab: Serverless Data Analysis with Dataflow: Side Inputs (Java)

  • آزمایشگاه: تجزیه و تحلیل داده های بدون سرور با جریان داده: ورودی های جانبی (جاوا) Lab: Serverless Data Analysis with Dataflow: Side Inputs (Java)

  • ایجاد و استفاده مجدد از الگوهای خط لوله Creating and re-using Pipeline Templates

  • ایجاد و استفاده مجدد از الگوهای خط لوله Creating and re-using Pipeline Templates

  • خطوط لوله Cloud Dataflow SQL Cloud Dataflow SQL pipelines

  • خطوط لوله Cloud Dataflow SQL Cloud Dataflow SQL pipelines

خلاصه Summary

  • خلاصه دوره Course Summary

  • خلاصه دوره Course Summary

نمایش نظرات

آموزش ساخت خطوط لوله داده دسته ای در GCP
جزییات دوره
2h 43m
98
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
14
4.2 از 5
ندارد
دارد
دارد
Google Cloud
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Google Cloud Google Cloud

ایجاد تحول دیجیتال با آموزش درخواستی

Google Cloud آموزش و گواهینامه های درخواستی را در فناوری های ابری در حال ظهور ارائه می دهد.

Google Cloud با صدها آزمایشگاه، دوره و نشان مهارت، متخصصان را قادر می‌سازد تا مهارت‌های ابری حیاتی را با سرعت خودشان ایجاد کنند. آزمایشگاه‌های عملی این شرکت اعتبارنامه‌های موقتی را به منابع واقعی ابر ارائه می‌دهند، بنابراین افراد می‌توانند Google Cloud را با استفاده از چیز واقعی یاد بگیرند. فراگیران همچنین می توانند با کسب گواهینامه های Google Cloud و/یا نشان های مهارتی که می توانند با شبکه خود به اشتراک بگذارند، تخصص خود را تأیید کنند.

در وب‌سایت رسمی Google Cloud بیشتر بیاموزید.