لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مهندسی داده بدون سرور (Serverless) - AWS Glue, Kinesis, Lambda
- آخرین آپدیت
دانلود Serverless Data Engineering - AWS Glue, Kinesis, Lambda
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
پردازش دستهای (Batch) و جریانی (Stream) با استفاده از فناوریهای Serverless در AWS
پردازش دستهای و جریانی با AWS Glue
استفاده از AWS Kinesis برای ورود دادههای جریانی به اکوسیستم AWS
نقش AWS Lambda در پردازش دادهها در یک خط لوله (Pipeline)
Apache Spark
مدیریت خط لوله دادهها با AWS Glue Workflow
پیش نیازها: مفاهیم پایه AWS مانند EC2, IAM, VPC و S3
مهندسی داده! این یک عبارت کلیدی در دنیای تکنولوژی امروز است. هر سازمانی به دنبال مهندسان داده است و طبق تحلیلها، این یکی از شغلهایی است که تحت تأثیر موج هوش مصنوعی قرار نخواهد گرفت. همچنین یکی از پردرآمدترین مشاغل دنیای فناوری است. تکنولوژیها، فریمورکها و ابزارهای متعددی برای تسهیل استک مهندسی داده وجود دارند، از جمله Spark، Kafka، Lakehouse و Data Warehouse.
تمام ارائهدهندگان خدمات ابری، استکهای کاملی از دادهها را ارائه میدهند. AWS، Azure و GCP پلتفرمهای متعددی برای کار روی استک داده فراهم کردهاند. یکی از جذابترین مدلها، مدل Serverless (بدون سرور) است؛ اصطلاحی که AWS با عرضه AWS Lambda ابداع کرد.
این دوره بهطور خاص بر روی پردازش دادههای بدون سرور (Serverless Data Processing) تمرکز دارد که در سالهای اخیر بسیار محبوب شده است. AWS پیشروترین رقیب در دنیای سرورلس است که پردازشهای دستهای و جریانی را شامل میشود. این دوره سرفصلهای زیر را پوشش میدهد:
پردازش دستهای بدون سرور بخش اول - AWS Glue
ورود دادههای جریانی - Kinesis Data Streams, Kinesis Firehose
پردازش جریانی بدون سرور بخش اول - AWS Glue و Kinesis
پردازش دستهای بدون سرور بخش دوم - AWS Lambda
پردازش جریانی بدون سرور بخش دوم - Lambda و Kinesis
حتماً تمرینات عملی را به طور کامل انجام دهید زیرا تجربه دست اول به شما میدهد. همچنین توصیه میشود تمام آزمایشگاههای عملی (Hands-on Labs) را گام به گام دنبال کنید.
سرفصل ها و درس ها
مقدمهای بر پردازش دادههای بدون سرور در AWS
Introduction to Serverless Data Processing on AWS
چرخه حیات داده و مهندسی داده
Data Lifecycle & Data Engineering
نقشه تکنولوژیهای مهندسی داده
Data Engineering Technology Mapping
سرویسهای Serverless در AWS برای مهندسی داده
AWS Serverless Offerings for Data Engineering
مزایای Serverless و معرفی دوره
Serverless benefits & About the Course
دوره فشرده اسپارک (Spark)
Spark Crash Course
محاسبات و ذخیرهسازی توزیع شده، Big Data و MapReduce
Distributed Compute & Storage, Big Data, MapReduce
اکوسیستم دادههای بزرگ (Big Data)
Big Data Ecosystem
فرمتهای فایل Parquet و Avro
File Format - Parquet & Avro
مقدمهای بر Spark، پردازش دستهای و جریانی
Intro to Spark, Batch & Stream Processing
خواندن خروجی Spark EXPLAIN Plan
Read Spark EXPLAIN Plan Output
توابع تاریخ (DATE Functions) در اسپارک
Spark DATE Functions
آمادهسازی EMR برای اجرای اپلیکیشنهای اسپارک
Prepare EMR to execute Spark Applications
ارسال کد اسپارک به EMR از طریق لپتاپ
Submit Spark code to EMR from Laptop
ETL دستهای بدون سرور با AWS Glue (Glue API و PySpark)
Serverless Batch ETL - AWS Glue (Glue API & PySpark)
مقدمهای بر AWS Glue
Introduction to AWS Glue
کاتالوگ داده (Data Catalog) و Glue Crawler
Data Catalog & Glue Crawler
تمرین عملی: استفاده از Glue Crawler برای خواندن فایلهای S3 و ذخیره متادیتا
HANDS-ON : Use Glue Crawler to read S3 files and Store Metadata in Data Catalog
تمرین عملی: اتصال Glue به سایر منابع داده توسط Crawler
HANDS-ON : Glue Connections for Other Data Sources by Crawler
پیکربندی Jobهای ETL بدون سرور در Glue
Glue Serverless ETL Job Configuration
ETL بصری بخش اول (تبدیل بدون کد): پیکربندی منابع داده S3
Visual ETL Part 1 (No Code Transformation) - Configure S3 Data Sources
ETL بصری بخش دوم (تبدیل بدون کد): افزودن تبدیلهای اسپارک
Visual ETL Part 2 (No Code Transformation) - Add Spark Transformations
ETL بصری بخش سوم (تبدیل بدون کد): خروجی تبدیلها
Visual ETL Part 3 (No Code Transformation) - Transformation Output
تمرین عملی: اجرای کد PySpark در AWS Glue
HANDS-ON - Execute PySpark Code in AWS Glue
مقدمهای بر Glue API
Glue API Introduction
تمرین عملی: Glue API - بارگذاری جدول MySQL از فایلهای S3
HANDS-ON : Glue API - Load MySQL Table from S3 Files
عملیات دیتابیس و DWH با PySpark در Glue
PySpark Database & DWH Operations from Glue
تمرین عملی: انتقال S3 به MySQL با استفاده از PySpark در Glue
HANDS-ON : S3 to MySQL using PySpark on Glue
پیشنیازهای VPC برای عملیات Redshift
VPC Pre-requisite for Redshift Operations
تمرین عملی: اتصال Glue و Crawler برای Redshift
HANDS-ON : Glue Connection & Crawler for Redshift
تمرین عملی: ETL با Glue API - انتقال MySQL OLTP به Redshift OLAP
HANDS-ON : ETL using Glue API - MySQL OLTP to Redshift OLAP
ETL با PySpark در Glue - انتقال MySQL به Redshift
ETL using PySpark on Glue - MySQL to Redshift
تمرین عملی: ETL با PySpark - انتقال MySQL OLTP به Redshift OLAP
HANDS-ON : ETL using PySpark - MySQL OLTP to Redshift OLAP
تمرین عملی: انتقال PySpark به Redshift بدون استفاده از Glue API
HANDS-ON : PySpark to Redshift WITHOUT Glue API
نمایش نظرات