دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش مهندسی داده بدون سرور (Serverless) - AWS Glue, Kinesis, Lambda - آخرین آپدیت

دانلود Serverless Data Engineering - AWS Glue, Kinesis, Lambda top rated

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: پردازش دسته‌ای (Batch) و جریانی (Stream) با استفاده از فناوری‌های Serverless در AWS پردازش دسته‌ای و جریانی با AWS Glue استفاده از AWS Kinesis برای ورود داده‌های جریانی به اکوسیستم AWS نقش AWS Lambda در پردازش داده‌ها در یک خط لوله (Pipeline) Apache Spark مدیریت خط لوله داده‌ها با AWS Glue Workflow پیش نیازها: مفاهیم پایه AWS مانند EC2, IAM, VPC و S3

مهندسی داده! این یک عبارت کلیدی در دنیای تکنولوژی امروز است. هر سازمانی به دنبال مهندسان داده است و طبق تحلیل‌ها، این یکی از شغل‌هایی است که تحت تأثیر موج هوش مصنوعی قرار نخواهد گرفت. همچنین یکی از پردرآمدترین مشاغل دنیای فناوری است. تکنولوژی‌ها، فریم‌ورک‌ها و ابزارهای متعددی برای تسهیل استک مهندسی داده وجود دارند، از جمله Spark، Kafka، Lakehouse و Data Warehouse.

تمام ارائه‌دهندگان خدمات ابری، استک‌های کاملی از داده‌ها را ارائه می‌دهند. AWS، Azure و GCP پلتفرم‌های متعددی برای کار روی استک داده فراهم کرده‌اند. یکی از جذاب‌ترین مدل‌ها، مدل Serverless (بدون سرور) است؛ اصطلاحی که AWS با عرضه AWS Lambda ابداع کرد.

این دوره به‌طور خاص بر روی پردازش داده‌های بدون سرور (Serverless Data Processing) تمرکز دارد که در سال‌های اخیر بسیار محبوب شده است. AWS پیشروترین رقیب در دنیای سرورلس است که پردازش‌های دسته‌ای و جریانی را شامل می‌شود. این دوره سرفصل‌های زیر را پوشش می‌دهد:

پردازش دسته‌ای بدون سرور بخش اول - AWS Glue
ورود داده‌های جریانی - Kinesis Data Streams, Kinesis Firehose
پردازش جریانی بدون سرور بخش اول - AWS Glue و Kinesis
پردازش دسته‌ای بدون سرور بخش دوم - AWS Lambda
پردازش جریانی بدون سرور بخش دوم - Lambda و Kinesis

حتماً تمرینات عملی را به طور کامل انجام دهید زیرا تجربه دست اول به شما می‌دهد. همچنین توصیه می‌شود تمام آزمایشگاه‌های عملی (Hands-on Labs) را گام به گام دنبال کنید.

سرفصل ها و درس ها

مقدمه‌ای بر پردازش داده‌های بدون سرور در AWS Introduction to Serverless Data Processing on AWS

چرخه حیات داده و مهندسی داده Data Lifecycle & Data Engineering
نقشه تکنولوژی‌های مهندسی داده Data Engineering Technology Mapping
سرویس‌های Serverless در AWS برای مهندسی داده AWS Serverless Offerings for Data Engineering
مزایای Serverless و معرفی دوره Serverless benefits & About the Course

دوره فشرده اسپارک (Spark) Spark Crash Course

محاسبات و ذخیره‌سازی توزیع شده، Big Data و MapReduce Distributed Compute & Storage, Big Data, MapReduce
اکوسیستم داده‌های بزرگ (Big Data) Big Data Ecosystem
فرمت‌های فایل Parquet و Avro File Format - Parquet & Avro
مقدمه‌ای بر Spark، پردازش دسته‌ای و جریانی Intro to Spark, Batch & Stream Processing
اکوسیستم، توسعه، معماری و اجرای اسپارک Spark Ecosystem, Development, Architecture & Execution
نصب Spark Spark Installation
راه‌اندازی کلاستر Standalone اسپارک روی لپ‌تاپ Spark Standalone Cluster in Laptop
اجرای Spark روی AWS EMR Spark on AWS EMR
مودهای استقرار اپلیکیشن اسپارک (deploy mode=cluster | client) Spark Application Deployment Modes (--deploy-mode=cluster | client)
مفاهیم DataFrame، DAG و ماژول PySpark DataFrame, DAG, PySpark Module
SparkSession چیست؟ What is SparkSession
خواننده و نویسنده DataFrame (Reader & Writer) DataFrame Reader & Writer
مفاهیم DataFrames، پارتیشن‌ها و تسک‌ها DataFrames, Partitions & Tasks
تبدیل‌ها: Select, Distinct, Where, Filter Transformations - Select, Distinct, Where, Filter
تمرین عملی: اکشن‌های اسپارک (Spark Actions) HANDS-ON : Spark Actions
بررسی رابط کاربری Spark UI Explore Spark UI
تبدیل‌ها: agg(), alias(), groupby() Transformation - agg(), alias(), groupby()
تبدیل‌ها: orderBy(), selectExpr() Transformation - orderBy(), selectExpr()
فرآیند Shuffle در groupBy Shuffle Process in groupBy
پارتیشن‌های ورودی (Input Partitions) Input Partitions
پارتیشن‌های خروجی (Output Partitions) Output Partitions
بررسی عمیق‌تر Spark UI Exploring Spark UI Further
خواندن خروجی Spark EXPLAIN Plan Read Spark EXPLAIN Plan Output
توابع تاریخ (DATE Functions) در اسپارک Spark DATE Functions
آماده‌سازی EMR برای اجرای اپلیکیشن‌های اسپارک Prepare EMR to execute Spark Applications
ارسال کد اسپارک به EMR از طریق لپ‌تاپ Submit Spark code to EMR from Laptop

ETL دسته‌ای بدون سرور با AWS Glue (Glue API و PySpark) Serverless Batch ETL - AWS Glue (Glue API & PySpark)

مقدمه‌ای بر AWS Glue Introduction to AWS Glue
کاتالوگ داده (Data Catalog) و Glue Crawler Data Catalog & Glue Crawler
تمرین عملی: استفاده از Glue Crawler برای خواندن فایل‌های S3 و ذخیره متادیتا HANDS-ON : Use Glue Crawler to read S3 files and Store Metadata in Data Catalog
تمرین عملی: اتصال Glue به سایر منابع داده توسط Crawler HANDS-ON : Glue Connections for Other Data Sources by Crawler
پیکربندی Jobهای ETL بدون سرور در Glue Glue Serverless ETL Job Configuration
ETL بصری بخش اول (تبدیل بدون کد): پیکربندی منابع داده S3 Visual ETL Part 1 (No Code Transformation) - Configure S3 Data Sources
ETL بصری بخش دوم (تبدیل بدون کد): افزودن تبدیل‌های اسپارک Visual ETL Part 2 (No Code Transformation) - Add Spark Transformations
ETL بصری بخش سوم (تبدیل بدون کد): خروجی تبدیل‌ها Visual ETL Part 3 (No Code Transformation) - Transformation Output
تمرین عملی: اجرای کد PySpark در AWS Glue HANDS-ON - Execute PySpark Code in AWS Glue
مقدمه‌ای بر Glue API Glue API Introduction
تمرین عملی: Glue API - بارگذاری جدول MySQL از فایل‌های S3 HANDS-ON : Glue API - Load MySQL Table from S3 Files
عملیات دیتابیس و DWH با PySpark در Glue PySpark Database & DWH Operations from Glue
تمرین عملی: انتقال S3 به MySQL با استفاده از PySpark در Glue HANDS-ON : S3 to MySQL using PySpark on Glue
پیش‌نیازهای VPC برای عملیات Redshift VPC Pre-requisite for Redshift Operations
تمرین عملی: اتصال Glue و Crawler برای Redshift HANDS-ON : Glue Connection & Crawler for Redshift
تمرین عملی: ETL با Glue API - انتقال MySQL OLTP به Redshift OLAP HANDS-ON : ETL using Glue API - MySQL OLTP to Redshift OLAP
ETL با PySpark در Glue - انتقال MySQL به Redshift ETL using PySpark on Glue - MySQL to Redshift
تمرین عملی: ETL با PySpark - انتقال MySQL OLTP به Redshift OLAP HANDS-ON : ETL using PySpark - MySQL OLTP to Redshift OLAP
تمرین عملی: انتقال PySpark به Redshift بدون استفاده از Glue API HANDS-ON : PySpark to Redshift WITHOUT Glue API
مدیریت گردش کار (Glue Workflow) - ارکستراسیون Jobهای ETL Glue Workflow - ETL Job Orchestration

ورود داده‌های جریانی با AWS Kinesis Data Streams Streaming Data Ingestion - AWS Kinesis Data Streams

مقدمه‌ای بر Kinesis Data Streams (KDS) Introduction to Kinesis Data Streams (KDS)
اجزاء و ظرفیت‌های Kinesis Streams (KDS) Kinesis Streams (KDS) - Components & Capacity
تمرین عملی: ایجاد KDS HANDS-ON : Create KDS
تمرین عملی: پیکربندی مودهای ظرفیت و Warm Throughput HANDS-ON : Configuration - Capacity Modes, Warm Throughtput
ارسال داده به KDS: متدهای put_record و put_records Send Data to KDS - put_record & put_records
تمرین عملی: راه‌اندازی محیط Python Boto3 HANDS-ON : Set up Python Boto3 Environment
تمرین عملی: ارسال داده به KDS HANDS-ON : Send Data to KDS
کتابخانه تولیدکننده کینسیس (KPL) Kinesis Producer Library (KPL)
مدیریت شاردها در کینسیس (Resharding) Kinesis Shard Management - Resharding
مصرف‌کنندگان استریم، Enhanced Fan out، شارد ایتریتور و پیاده‌سازی با Python SDK Stream Consumers, Enhanced Fan-out, Shard Iterator, Python SDK Implementation
تمرین عملی: خواندن رکوردها از KDS با Python SDK و Multi-threading HANDS-ON : Read Records from KDS using Python SDK & Multi-threading
کتابخانه کلاینت کینسیس (KCL)، Agent و متریک‌های CloudWatch Kinesis Client Library (KCL), Agent, CloudWatch Metrics

ذخیره‌سازی داده‌های جریانی با Kinesis (Amazon) Data Firehose Streaming Data Storage - Kinesis (Amazon) Data Firehose

Kinesis Data Firehose و بافر داده‌ها Kinesis (Amazon) Data Firehose, Data Buffer
پردازش در Data Firehose با استفاده از Lambda Processing at Data Firehose using Lambda
مقصد جدول Iceberg Iceberg Table Destination
تمرین عملی: ارسال داده از KDS به Data Firehose HANDS-ON : Send Data from KDS to Data Firehose
تمرین عملی: استفاده از Python SDK برای نوشتن رکوردها در Data Firehose HANDS-ON : Python SDK to Write Records in (Kinesis) Data Firehose

دوره فشرده Spark Streaming Spark Streaming Crash Course

مقدمه‌ای بر Spark Streaming، تریگرها و مودهای خروجی Spark Streaming Intro, Trigger, Output Mode
تمرین عملی: PySpark Streaming با استفاده از Console Sink HANDS-ON : PySpark Streaming using Console Sink
زمان رویداد (Event Time) و پنجره‌های Tumbling Event Time - Tumbling Window
تمرین عملی: زمان رویداد و پنجره Tumbling HANDS-ON : Event Time - Tumbling Window
تمرین عملی: زمان رویداد و پنجره لغزنده (Sliding Window) HANDS-ON : Event Time - Sliding Window

پردازش جریانی بدون سرور با AWS Glue و Kinesis Serverlss Stream Processing - AWS Glue & Kinesis

پردازش جریانی در AWS Glue Stream Processing on AWS Glue
دفترچه Jupyter در Glue Streaming - معماری عملی Glue Streaming Jupyter Notebook - Hands On Architecture
تمرین عملی: آماده‌سازی محیط دفترچه Glue HANDS-ON : Prepare Glue Notebook Environment
تمرین عملی: انتقال Kinesis به S3 با استفاده از دفترچه Glue HANDS-ON : Kinesis to S3 using Glue Notebook
تمرین عملی: پیاده‌سازی Tumbling Window در دفترچه Glue HANDS-ON - Stream Tumbling Window on Glue Notebook
تمرین عملی: پردازش جریانی با Sliding Window در دفترچه Glue HANDS-ON : Stream Processing SLIDING Window on Glue Notebook
تمرین عملی: پردازش جریانی با Tumbling Window با استفاده از Glue ETL HANDS-ON : Stream Processing Tumbling Window using Glue ETL

پردازش دسته‌ای بدون سرور با AWS Lambda Serverless Batch Processing - AWS Lambda

مقدمه‌ای بر محاسبات بدون سرور و موارد استفاده از AWS Lambda Intro to Serverless Compute & AWS Lambda Use Cases
تابع Lambda و اجزای آن Lambda Function & its Components
تمرین عملی: پیکربندی تابع Lambda و اجزای آن HANDS-ON : Configure Lambda Function & its Components
مدل اجرای کد در Lambda Lambda Code Execution Model
تمرین عملی: نوشتن کد پایتون در کنسول Lambda و داده‌های 'Event' HANDS-ON : Write Python Code from Lambda Console, 'Event' data
تمرین عملی: تریگر S3 > خواندن فایل > کپی در tmp > چاپ داده‌ها HANDS-ON : S3 Trigger -> Read File -> Copy to /tmp -> Print data
تمرین عملی: تریگر S3 > خواندن فایل > پردازش > نوشتن در پوشه S3 HANDS-ON : S3 Trigger -> Read File -> Process -> Write to S3 Folder
تمرین عملی: ایجاد بسته Deployment به صورت ZIP برای کد پایتون HANDS-ON : Create ZIP Deployment Package for Python Code
تمرین عملی: استقرار پکیج‌ها و ماژول‌های اضافی پایتون با ZIP در Lambda HANDS-ON : Deploy Additional Python Packages & Modules using ZIP in Lambda
تمرین عملی: تریگر S3 به دیتابیس و اجرای همزمان (Concurrent) لایمدا HANDS-ON : S3 Trigger to Database & Concurrent Lambda Execution
معماری‌های مبتنی بر Lambda Architecture using Lambda

پردازش جریانی بدون سرور با AWS Lambda و Kinesis Serverless Stream Processing - AWS Lambda & Kinesis

استریم با Lambda، نگاشت منبع رویداد و فیلترینگ رویدادها Streaming with Lambda, Event Source Mapping, Event Filtering
الگوی پردازش رکورد و متغیرهای پیکربندی استریم Record Processing Template & Stream Configuration Variables
تمرین عملی: راه‌اندازی یکپارچگی Lambda و Kinesis HANDS-ON : Set Up Lambda & Kinesis Integration
تمرین عملی: مدیریت داده‌های استریم و پیکربندی Lambda برای Kinesis HANDS-ON : Handling Stream Data, Lambda Configuration for Kinesis
تمرین عملی: کدنویسی در Lambda، مانیتورینگ اجرا و بررسی لاگ‌ها HANDS-ON : CODING in Lambda, Monitor Execution, Check Log Output
تمرین عملی: کدنویسی Lambda برای خواندن از Kinesis و نوشتن در S3 HANDS-ON : Lambda Coding to Read from Kinesis and Write to S3

الگوهای معماری بدون سرور Serverless Architectural Patterns

الگوی اول: معماری Lambda Pattern 1 - Lambda Architecture
الگوی دوم: معماری Kappa Pattern 2 - Kappa Architecture
الگوی سوم: معماری Medallion Pattern 3 - Medallion Architecture
الگوی چهارم: تحلیل داده برای اپلیکیشن‌های IoT Pattern 4 - Analytics for IoT Applications
الگوی پنجم: تحلیل اپلیکیشن‌های وب Pattern 5 - Web Application Analytics
الگوی ششم: استخراج، بارگذاری و تبدیل (ELT) Pattern 6 - Extract, Load & Transform (ELT)

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش مهندسی داده بدون سرور (Serverless) - AWS Glue, Kinesis, Lambda

جزییات دوره

زمان دوره: 17.5 hours

تعداد ویدیو ها: 102

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 75

امتیاز مرجع: 4.8 از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Soumyadeep Dey

لینک کوتاه این دوره

https://donyad.com/d/c602e4

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

آموزش مهندسی داده بدون سرور (Serverless) - AWS Glue, Kinesis, Lambda - آخرین آپدیت

دانلود Serverless Data Engineering - AWS Glue, Kinesis, Lambda top rated

مقدمه‌ای بر پردازش داده‌های بدون سرور در AWS Introduction to Serverless Data Processing on AWS

چرخه حیات داده و مهندسی داده Data Lifecycle & Data Engineering

نقشه تکنولوژی‌های مهندسی داده Data Engineering Technology Mapping

سرویس‌های Serverless در AWS برای مهندسی داده AWS Serverless Offerings for Data Engineering

مزایای Serverless و معرفی دوره Serverless benefits & About the Course

دوره فشرده اسپارک (Spark) Spark Crash Course

محاسبات و ذخیره‌سازی توزیع شده، Big Data و MapReduce Distributed Compute & Storage, Big Data, MapReduce

اکوسیستم داده‌های بزرگ (Big Data) Big Data Ecosystem

فرمت‌های فایل Parquet و Avro File Format - Parquet & Avro

مقدمه‌ای بر Spark، پردازش دسته‌ای و جریانی Intro to Spark, Batch & Stream Processing

اکوسیستم، توسعه، معماری و اجرای اسپارک Spark Ecosystem, Development, Architecture & Execution

نصب Spark Spark Installation

راه‌اندازی کلاستر Standalone اسپارک روی لپ‌تاپ Spark Standalone Cluster in Laptop

اجرای Spark روی AWS EMR Spark on AWS EMR

مودهای استقرار اپلیکیشن اسپارک (deploy mode=cluster | client) Spark Application Deployment Modes (--deploy-mode=cluster | client)

مفاهیم DataFrame، DAG و ماژول PySpark DataFrame, DAG, PySpark Module

SparkSession چیست؟ What is SparkSession

خواننده و نویسنده DataFrame (Reader & Writer) DataFrame Reader & Writer

مفاهیم DataFrames، پارتیشن‌ها و تسک‌ها DataFrames, Partitions & Tasks

تبدیل‌ها: Select, Distinct, Where, Filter Transformations - Select, Distinct, Where, Filter

تمرین عملی: اکشن‌های اسپارک (Spark Actions) HANDS-ON : Spark Actions

بررسی رابط کاربری Spark UI Explore Spark UI

تبدیل‌ها: agg(), alias(), groupby() Transformation - agg(), alias(), groupby()

تبدیل‌ها: orderBy(), selectExpr() Transformation - orderBy(), selectExpr()

فرآیند Shuffle در groupBy Shuffle Process in groupBy

پارتیشن‌های ورودی (Input Partitions) Input Partitions

پارتیشن‌های خروجی (Output Partitions) Output Partitions

بررسی عمیق‌تر Spark UI Exploring Spark UI Further

خواندن خروجی Spark EXPLAIN Plan Read Spark EXPLAIN Plan Output

توابع تاریخ (DATE Functions) در اسپارک Spark DATE Functions

آماده‌سازی EMR برای اجرای اپلیکیشن‌های اسپارک Prepare EMR to execute Spark Applications

ارسال کد اسپارک به EMR از طریق لپ‌تاپ Submit Spark code to EMR from Laptop

ETL دسته‌ای بدون سرور با AWS Glue (Glue API و PySpark) Serverless Batch ETL - AWS Glue (Glue API & PySpark)

مقدمه‌ای بر AWS Glue Introduction to AWS Glue

کاتالوگ داده (Data Catalog) و Glue Crawler Data Catalog & Glue Crawler

تمرین عملی: استفاده از Glue Crawler برای خواندن فایل‌های S3 و ذخیره متادیتا HANDS-ON : Use Glue Crawler to read S3 files and Store Metadata in Data Catalog

تمرین عملی: اتصال Glue به سایر منابع داده توسط Crawler HANDS-ON : Glue Connections for Other Data Sources by Crawler

پیکربندی Jobهای ETL بدون سرور در Glue Glue Serverless ETL Job Configuration

ETL بصری بخش اول (تبدیل بدون کد): پیکربندی منابع داده S3 Visual ETL Part 1 (No Code Transformation) - Configure S3 Data Sources

ETL بصری بخش دوم (تبدیل بدون کد): افزودن تبدیل‌های اسپارک Visual ETL Part 2 (No Code Transformation) - Add Spark Transformations

ETL بصری بخش سوم (تبدیل بدون کد): خروجی تبدیل‌ها Visual ETL Part 3 (No Code Transformation) - Transformation Output

تمرین عملی: اجرای کد PySpark در AWS Glue HANDS-ON - Execute PySpark Code in AWS Glue

مقدمه‌ای بر Glue API Glue API Introduction

تمرین عملی: Glue API - بارگذاری جدول MySQL از فایل‌های S3 HANDS-ON : Glue API - Load MySQL Table from S3 Files

عملیات دیتابیس و DWH با PySpark در Glue PySpark Database & DWH Operations from Glue

تمرین عملی: انتقال S3 به MySQL با استفاده از PySpark در Glue HANDS-ON : S3 to MySQL using PySpark on Glue

پیش‌نیازهای VPC برای عملیات Redshift VPC Pre-requisite for Redshift Operations

تمرین عملی: اتصال Glue و Crawler برای Redshift HANDS-ON : Glue Connection & Crawler for Redshift

تمرین عملی: ETL با Glue API - انتقال MySQL OLTP به Redshift OLAP HANDS-ON : ETL using Glue API - MySQL OLTP to Redshift OLAP

ETL با PySpark در Glue - انتقال MySQL به Redshift ETL using PySpark on Glue - MySQL to Redshift

تمرین عملی: ETL با PySpark - انتقال MySQL OLTP به Redshift OLAP HANDS-ON : ETL using PySpark - MySQL OLTP to Redshift OLAP

تمرین عملی: انتقال PySpark به Redshift بدون استفاده از Glue API HANDS-ON : PySpark to Redshift WITHOUT Glue API

مدیریت گردش کار (Glue Workflow) - ارکستراسیون Jobهای ETL Glue Workflow - ETL Job Orchestration

ورود داده‌های جریانی با AWS Kinesis Data Streams Streaming Data Ingestion - AWS Kinesis Data Streams

مقدمه‌ای بر Kinesis Data Streams (KDS) Introduction to Kinesis Data Streams (KDS)

اجزاء و ظرفیت‌های Kinesis Streams (KDS) Kinesis Streams (KDS) - Components & Capacity

تمرین عملی: ایجاد KDS HANDS-ON : Create KDS

تمرین عملی: پیکربندی مودهای ظرفیت و Warm Throughput HANDS-ON : Configuration - Capacity Modes, Warm Throughtput

ارسال داده به KDS: متدهای put_record و put_records Send Data to KDS - put_record & put_records

تمرین عملی: راه‌اندازی محیط Python Boto3 HANDS-ON : Set up Python Boto3 Environment

تمرین عملی: ارسال داده به KDS HANDS-ON : Send Data to KDS

کتابخانه تولیدکننده کینسیس (KPL) Kinesis Producer Library (KPL)

مدیریت شاردها در کینسیس (Resharding) Kinesis Shard Management - Resharding

مصرف‌کنندگان استریم، Enhanced Fan out، شارد ایتریتور و پیاده‌سازی با Python SDK Stream Consumers, Enhanced Fan-out, Shard Iterator, Python SDK Implementation

تمرین عملی: خواندن رکوردها از KDS با Python SDK و Multi-threading HANDS-ON : Read Records from KDS using Python SDK & Multi-threading

کتابخانه کلاینت کینسیس (KCL)، Agent و متریک‌های CloudWatch Kinesis Client Library (KCL), Agent, CloudWatch Metrics

ذخیره‌سازی داده‌های جریانی با Kinesis (Amazon) Data Firehose Streaming Data Storage - Kinesis (Amazon) Data Firehose

Kinesis Data Firehose و بافر داده‌ها Kinesis (Amazon) Data Firehose, Data Buffer

پردازش در Data Firehose با استفاده از Lambda Processing at Data Firehose using Lambda

مقصد جدول Iceberg Iceberg Table Destination

تمرین عملی: ارسال داده از KDS به Data Firehose HANDS-ON : Send Data from KDS to Data Firehose

تمرین عملی: استفاده از Python SDK برای نوشتن رکوردها در Data Firehose HANDS-ON : Python SDK to Write Records in (Kinesis) Data Firehose

دوره فشرده Spark Streaming Spark Streaming Crash Course

مقدمه‌ای بر Spark Streaming، تریگرها و مودهای خروجی Spark Streaming Intro, Trigger, Output Mode

تمرین عملی: PySpark Streaming با استفاده از Console Sink HANDS-ON : PySpark Streaming using Console Sink

زمان رویداد (Event Time) و پنجره‌های Tumbling Event Time - Tumbling Window

تمرین عملی: زمان رویداد و پنجره Tumbling HANDS-ON : Event Time - Tumbling Window

تمرین عملی: زمان رویداد و پنجره لغزنده (Sliding Window) HANDS-ON : Event Time - Sliding Window