آموزش Apache Flink: تجزیه و تحلیل داده های اکتشافی با SQL

Apache Flink: Exploratory Data Analytics with SQL

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: تجزیه و تحلیل داده های اکتشافی یک مرحله اساسی در علم داده است که با بررسی داده ها برای استخراج بینش سروکار دارد. در دنیای داده های بزرگ ، جستجوی مجموعه داده های عظیم یک چالش است ، زیرا به فناوری هایی نیاز دارد که مقیاس پذیر ، سریع و دارای ویژگی های غنی باشند. Apache Flink - بستر محبوب پردازش جریان - برای این تلاش کاملا مناسب است. این دوره بر بررسی مجموعه داده ها با SQL در Apache Flink تمرکز دارد. Kumaran Ponnambalam مربی کار خود را با مرور API های رابطه ای که Flink برای تجزیه و تحلیل داده های بزرگ فراهم می کند شروع می کند. سپس کوماران نگاه عمیق تری به توابع Table API و SQL دارد. او قابلیت های مختلف SQL موجود برای کاوش داده ها ، از جمله فیلتر کردن ، تجمیع و پیوستن را کشف می کند. برای جمع بندی ، او یک پروژه مورد استفاده را ارائه می دهد که به شما امکان می دهد مهارت های جدید خود را تمرین کنید.
موضوعات شامل:
  • اتصالات و یکپارچه سازی های موجود در API های Flink
  • ایجاد جداول از CSV
  • انتخاب و فیلتر کردن داده های جدول
  • استفاده از توابع تجمع در SQL
  • پیوستن به جداول
  • پنجره در جریان ها
  • زمان برگزاری با جداول Flink

سرفصل ها و درس ها

مقدمه Introduction

  • Apache Flink برای تجزیه و تحلیل اکتشافی Apache Flink for exploratory analysis

1. API های رابطه ای Flink 1. Flink Relational APIs

  • Apache Flink چیست؟ What is Apache Flink?

  • چشم انداز API های رابطه ای Flink relational APIs

  • ادغام و اتصالات Integrations and connectors

  • پیش نیازهای دوره Course prerequisites

  • تنظیم پرونده های تمرینی Setting up the exercise files

2. تجزیه و تحلیل اساسی دسته ای 2. Basic Batch Analytics

  • ایجاد یک محیط میز Creating a table environment

  • ایجاد جداول از CSV Creating tables from a CSV

  • انتخاب داده های جدول Selecting table data

  • فیلتر کردن داده ها در جداول Filtering data in tables

  • نوشتن جداول به پرونده ها Writing tables to files

3. تجزیه و تحلیل پیشرفته دسته ای 3. Advanced Batch Analytics

  • جمع شدن بر روی جداول Aggregations on tables

  • سفارش و محدود کردن داده ها Ordering and limiting data

  • اضافه کردن ستون های جدید Adding new columns

  • جداول پیوستن Joining tables

  • کار با مجموعه داده ها Working with datasets

4. جریان SQL 4. Streaming SQL

  • چالش هایی با پخش SQL Challenges with streaming SQL

  • جداول پویا Dynamic tables

  • افزودن و جمع کردن داده ها Appending and retracting data

  • منابع کافکا را مصرف می کنید Consuming Kafka sources

  • در حال انجام نمایش داده شد Running continuous queries

5. تجزیه و تحلیل جریان پیشرفته 5. Advanced Streaming Analytics

  • باد در جریان Windowing on streams

  • با استفاده از پنجره های خاموش و کشویی Using tumbling and sliding windows

  • جداول نوشتن به کافکا Writing tables to Kafka

  • کار با جریان داده ها Working with data streams

  • با استفاده از زمان رویداد Using event time

6. از Project Case استفاده کنید 6. Use Case Project

  • از تعریف مسئله مورد استفاده کنید Use case problem definition

  • داده های منبع را در یک جدول Flink بخوانید Read source data into a Flink table

  • کل نمرات را محاسبه کنید Compute total scores

  • محاسبه جمع Compute aggregations

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش Apache Flink: تجزیه و تحلیل داده های اکتشافی با SQL
جزییات دوره
1h 7m
31
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
320
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kumaran Ponnambalam Kumaran Ponnambalam

اختصاص به آموزش علوم داده

V2 Maestros به آموزش علوم داده و داده های بزرگ با هزینه های مقرون به صرفه برای جهان اختصاص دارد. مربیان ما تجربه دنیای واقعی در تمرین علم داده و ارائه نتایج تجاری دارند. علم داده یک حوزه داغ و در حال رخ دادن در صنعت فناوری اطلاعات است. متأسفانه منابع موجود برای یادگیری این مهارت به سختی یافت می شود و گران است. امیدواریم این مشکل را با ارائه آموزش باکیفیت با نرخ های مقرون به صرفه، با ایجاد استعدادهای علم داده در سراسر جهان، کاهش دهیم.