لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش (GCP-PDE) جذب و پردازش دادهها
- آخرین آپدیت
دانلود (GCP-PDE) Ingesting and Processing the Data
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
سازمانها بهطور فزایندهای برای مدیریت منابع داده متنوع، نیازهای جذب دادههای آنی (Real-time) و انتظارات رو به رشد برای داشتن دادههای پاک و قابل اعتماد با چالش روبرو هستند؛ موضوعی که طراحی دقیق خط لولههای داده (Data Pipelines) را ضروری میسازد. در این دوره آموزشی با عنوان «جذب و پردازش دادهها (GCP-PDE)»، شما توانایی ساخت خط لولههای مقیاسپذیر دستهای (Batch) و جریانی (Streaming) را کسب خواهید کرد تا کیفیت دادهها و آمادگی آنها برای تحلیلهای پاییندستی تضمین شود. ابتدا، با درک منابع، مقصودها (Sinks)، منطق تبدیل دادهها، مبانی شبکه و استراتژیهای رمزنگاری، نحوه برنامهریزی خط لولههای داده را بررسی میکنید. سپس، نحوه ساخت این خط لولهها را با استفاده از سرویسهای Google Cloud از جمله Dataflow، Pub/Sub، BigQuery، Cloud Data Fusion و سایر ابزارها، در هر دو رویکرد کدنویسی و بدون کد (No-code) خواهید آموخت. در نهایت، یاد میگیرید که چگونه خط لولههای خود را با استفاده از Cloud Composer، Cloud Workflows، CI/CD و زیرساخت به عنوان کد (IaC) مستقر و عملیاتی کنید. پس از اتمام این دوره، شما مهارتها و دانش لازم در زمینه جذب و پردازش دادههای گوگل کلاود را برای ایجاد خط لولههای قابل اعتماد، مقیاسپذیر و آماده تولید (Production-ready) کسب کرده و برای پاسخ به سوالات این بخش در آزمون گواهینامه Professional Data Engineer آماده خواهید بود.
سرفصل ها و درس ها
برنامهریزی خط لولههای داده
Planning Data Pipelines
نیازمندیهای سیستم و نرمافزاری
System and Software Requirements
پردازش دستهای و جریانی
Batch and Stream Processing
خط لولههای داده و چارچوبهای ارکستراسیون
Data Pipelines and Orchestration Frameworks
خط لولههای دستهای در گوگل کلاود
Batch Pipelines on Google Cloud
مقایسه خط لولههای ETL و ELT
ETL vs. ELT Pipelines
پردازش جریانی در گوگل کلاود
Stream Processing on Google Cloud
رویکردهای ترکیبی ETL و ELT و انتخاب گزینه مناسب
Hybrid ETL and ELT Approaches and Choosing the Right Pipeline Option
خط لولههای بدون سرور با Dataflow
Serverless Pipelines with Dataflow
تبدیلهای اصلی دادهها
Core Data Transforms
مفاهیم پیشرفته Dataflow: ورودیهای جانبی، خروجیهای جانبی و جداول Dead Letter
Advanced Dataflow Concepts Side Inputs Side Outputs Dead Letter Tables
مفاهیم پیشرفته Dataflow: ادغام و تفکیک (Fusion and Unfusion)
Advanced Dataflow Concepts Fusion and Unfusion
الگوها و پرچمهای (Flags) دیتافلو
Dataflow Templates and Dataflow Flags
گردشکارهای Hadoop با Dataproc
Hadoop Workflows with Dataproc
پردازش جریانی Spark با Dataproc Serverless
Spark Streaming with Dataproc Serverless
انتخاب سرویس مناسب برای پردازش دادهها
Choosing the Right Data Processing Service
جریان داده با Pub/Sub
Streaming with Pub/Sub
مفاهیم کلیدی Pub/Sub
Key Pub/Sub Concepts
ساخت خط لولههای داده
Building Data Pipelines
پاکسازی دادهها با DataPrep
Data Cleansing with DataPrep
دمو: پیکربندی خط لوله Dataflow برای پردازش دستهای
Demo: Configure a Dataflow Pipeline for Batch Processing
دمو: اجرای خط لوله دستهای در Dataflow
Demo: Running a Batch Pipeline on Dataflow
دمو: پیکربندی خط لوله Dataflow با خروجی جانبی
Demo: Configure a Dataflow Pipeline with Side Output
دمو: پیکربندی خط لوله Dataflow با ورودی جانبی
Demo: Configure a Dataflow Pipeline with Side Input
دمو: راهاندازی و پیکربندی کلاستر Dataproc
Demo: Set up and Configure a Dataproc Cluster
دمو: اجرای جاب پردازش دستهای Spark در Dataproc
Demo: Run a Spark Batch Processing Job on Dataproc
دمو: اجرای جاب Spark در Dataproc Serverless
Demo: Run a Spark Job on Dataproc Serverless
دمو: راهاندازی Topic و Subscription در Pub/Sub
Demo: Set up a Pub/Sub Topic and Subscription
دمو: پردازش جریانی پیامهای Pub/Sub با استفاده از Dataflow
Demo: Stream Processing Messages from Pub/Sub Using Dataflow
پنجرهبندی (Windowing) در دادههای جریانی
Windowing on Streaming Data
انواع پنجرهها و انتخاب نوع مناسب
Types of Windows and Choosing the Right Type
واترمارکها (Watermarks) و دادههای دیر رسیده
Watermarks and Late Data
استقرار و عملیاتیسازی خط لولههای داده
Deploying and Operationalizing Data Pipelines
ارکستراسیون گردشکارها با Cloud Composer
Orchestrating Workflows Using Cloud Composer
ارکستراسیون گردشکارها با Cloud Workflows
Orchestrating Workflows Using Cloud Workflows
انتخاب چارچوب ارکستراسیون مناسب
Choosing the Right Orchestration Framework
پیادهسازی CI/CD در گوگل کلاود
CI/CD on Google Cloud
آمادگی برای آزمون
Exam Preparation
مباحث مهم برای آزمون
Important Topics for the Exam
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات