آموزش Data Science on Google Cloud Platform: ساخت خطوط لوله داده

Data Science on Google Cloud Platform: Building Data Pipelines

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: رایانش ابری مقیاس پذیری و کشش نامحدودی را برای برنامه های کاربردی علوم داده به ارمغان می آورد. تخصص در سیستم عامل های بزرگ مانند Google Cloud Platform (GCP) برای متخصص فناوری اطلاعات ضروری است. این دوره - یکی از مجموعه های متخصص و مهندس ابر کهنه کار و دانشمندان داده Kumaran Ponnambalam - نشان می دهد که چگونه می توان از جدیدترین فن آوری ها در GCP برای ساخت یک خط لوله داده بزرگ استفاده کرد ، داده ها را به طور کامل در ابر می بلعید ، حمل و نقل می کند. با نحوه تنظیم مشاغل پردازش داده با استفاده از Apache Beam و Cloud Dataflow آشنا شوید. نحوه استفاده از Cloud Pub / Sub را برای مصرف جریان و پیام رسانی در زمان واقعی کشف کنید. در آخر ، نحوه پردازش رویدادهای جریان را در Cloud Dataflow بیابید. این دوره از یک مورد استفاده از انتها به انتها استفاده می کند که نشان می دهد چگونه دانش و بهترین روش های دوره را در یک گردش کار علمی داده استفاده کنید.
موضوعات شامل:
  • محصولات GCP برای خطوط لوله داده
  • راه اندازی خط لوله با Apache Beam و Cloud Dataflow
  • پردازش داده ها با Beam و Dataflow
  • بلعیدن جریانها با Cloud Pub / Sub
  • انجام تجزیه و تحلیل جریان با جریان داده

سرفصل ها و درس ها

مقدمه Introduction

  • چه چیزی وارد یک خط لوله داده می شود؟ What goes into a data pipeline?

  • ماژول های علم داده را پوشانده است Data science modules covered

1. محصولات خط لوله داده GCP 1. GCP Data Pipeline Products

  • گزینه های خط لوله داده GCP GCP data pipeline options

  • Cloud Dataproc Cloud Dataproc

  • Cloud Dataflow Cloud Dataflow

  • Cloud Pub / Sub Cloud Pub/Sub

2. پرتو آپاچی 2. Apache Beam

  • پرتوی آپاچی چیست؟ What is Apache Beam?

  • خطوط لوله پرتو Beam pipelines

  • رایانه های شخصی PCollections

  • تحولات Transforms

  • خط لوله I / O Pipeline I/O

  • دونده ها Runners

3. تنظیم Dataflow 3. Setting Up Dataflow

  • تنظیم GCP برای Dataflow Setting up GCP for Dataflow

  • تنظیم پایتون Setting up Python

  • ایجاد یک خط لوله ساده Creating a simple pipeline

  • اعدام در Dataflow Executing in Dataflow

4- پردازش داده ها با Beam و Dataflow 4. Data Processing with Beam and Dataflow

  • خواندن فایل های متنی Reading text files

  • پارودو ParDo

  • دسته بندی بر اساس GroupBy

  • نقشه Map

  • ترکیب Combine

  • نوشتن داده ها به پرونده های متنی Writing data to text files

  • سایر قابلیت ها Other capabilities

5. ابر بار / زیر 5. Cloud Pub/Sub

  • میخانه / زیر چیست؟ What is Pub/Sub?

  • مباحث و پیام ها Topics and messages

  • ناشران Publishers

  • مشترکین Subscribers

  • مبحث ایجاد کنید Create a topic

  • اشتراک ایجاد کنید Create a subscription

  • انتشار و دریافت کنید Publish and receive

  • پایتون SDK Python SDK

6. جریان با Dataflow 6. Streaming with Dataflow

  • جریان با Dataflow Streaming with Dataflow

  • پنجره با Dataflow Windowing with Dataflow

  • مثال جریان و جریان باد Streaming and windowing example

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش Data Science on Google Cloud Platform: ساخت خطوط لوله داده
جزییات دوره
1h 7m
35
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
14,204
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kumaran Ponnambalam Kumaran Ponnambalam

اختصاص به آموزش علوم داده

V2 Maestros به آموزش علوم داده و داده های بزرگ با هزینه های مقرون به صرفه برای جهان اختصاص دارد. مربیان ما تجربه دنیای واقعی در تمرین علم داده و ارائه نتایج تجاری دارند. علم داده یک حوزه داغ و در حال رخ دادن در صنعت فناوری اطلاعات است. متأسفانه منابع موجود برای یادگیری این مهارت به سختی یافت می شود و گران است. امیدواریم این مشکل را با ارائه آموزش باکیفیت با نرخ های مقرون به صرفه، با ایجاد استعدادهای علم داده در سراسر جهان، کاهش دهیم.