آموزش (GCP-PDE) جذب و پردازش داده‌ها - آخرین آپدیت

دانلود (GCP-PDE) Ingesting and Processing the Data

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: سازمان‌ها به‌طور فزاینده‌ای برای مدیریت منابع داده متنوع، نیازهای جذب داده‌های آنی (Real-time) و انتظارات رو به رشد برای داشتن داده‌های پاک و قابل اعتماد با چالش روبرو هستند؛ موضوعی که طراحی دقیق خط لوله‌های داده (Data Pipelines) را ضروری می‌سازد. در این دوره آموزشی با عنوان «جذب و پردازش داده‌ها (GCP-PDE)»، شما توانایی ساخت خط لوله‌های مقیاس‌پذیر دسته‌ای (Batch) و جریانی (Streaming) را کسب خواهید کرد تا کیفیت داده‌ها و آمادگی آن‌ها برای تحلیل‌های پایین‌دستی تضمین شود. ابتدا، با درک منابع، مقصودها (Sinks)، منطق تبدیل داده‌ها، مبانی شبکه و استراتژی‌های رمزنگاری، نحوه برنامه‌ریزی خط لوله‌های داده را بررسی می‌کنید. سپس، نحوه ساخت این خط لوله‌ها را با استفاده از سرویس‌های Google Cloud از جمله Dataflow، Pub/Sub، BigQuery، Cloud Data Fusion و سایر ابزارها، در هر دو رویکرد کدنویسی و بدون کد (No-code) خواهید آموخت. در نهایت، یاد می‌گیرید که چگونه خط لوله‌های خود را با استفاده از Cloud Composer، Cloud Workflows، CI/CD و زیرساخت به عنوان کد (IaC) مستقر و عملیاتی کنید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم در زمینه جذب و پردازش داده‌های گوگل کلاود را برای ایجاد خط لوله‌های قابل اعتماد، مقیاس‌پذیر و آماده تولید (Production-ready) کسب کرده و برای پاسخ به سوالات این بخش در آزمون گواهینامه Professional Data Engineer آماده خواهید بود.

سرفصل ها و درس ها

برنامه‌ریزی خط لوله‌های داده Planning Data Pipelines

  • نیازمندی‌های سیستم و نرم‌افزاری System and Software Requirements

  • پردازش دسته‌ای و جریانی Batch and Stream Processing

  • خط لوله‌های داده و چارچوب‌های ارکستراسیون Data Pipelines and Orchestration Frameworks

  • خط لوله‌های دسته‌ای در گوگل کلاود Batch Pipelines on Google Cloud

  • مقایسه خط لوله‌های ETL و ELT ETL vs. ELT Pipelines

  • پردازش جریانی در گوگل کلاود Stream Processing on Google Cloud

  • رویکردهای ترکیبی ETL و ELT و انتخاب گزینه مناسب Hybrid ETL and ELT Approaches and Choosing the Right Pipeline Option

  • خط لوله‌های بدون سرور با Dataflow Serverless Pipelines with Dataflow

  • تبدیل‌های اصلی داده‌ها Core Data Transforms

  • مفاهیم پیشرفته Dataflow: ورودی‌های جانبی، خروجی‌های جانبی و جداول Dead Letter Advanced Dataflow Concepts Side Inputs Side Outputs Dead Letter Tables

  • مفاهیم پیشرفته Dataflow: ادغام و تفکیک (Fusion and Unfusion) Advanced Dataflow Concepts Fusion and Unfusion

  • الگوها و پرچم‌های (Flags) دیتافلو Dataflow Templates and Dataflow Flags

  • گردش‌کارهای Hadoop با Dataproc Hadoop Workflows with Dataproc

  • پردازش جریانی Spark با Dataproc Serverless Spark Streaming with Dataproc Serverless

  • انتخاب سرویس مناسب برای پردازش داده‌ها Choosing the Right Data Processing Service

  • جریان داده با Pub/Sub Streaming with Pub/Sub

  • مفاهیم کلیدی Pub/Sub Key Pub/Sub Concepts

ساخت خط لوله‌های داده Building Data Pipelines

  • پاک‌سازی داده‌ها با DataPrep Data Cleansing with DataPrep

  • دمو: پیکربندی خط لوله Dataflow برای پردازش دسته‌ای Demo: Configure a Dataflow Pipeline for Batch Processing

  • دمو: اجرای خط لوله دسته‌ای در Dataflow Demo: Running a Batch Pipeline on Dataflow

  • دمو: پیکربندی خط لوله Dataflow با خروجی جانبی Demo: Configure a Dataflow Pipeline with Side Output

  • دمو: پیکربندی خط لوله Dataflow با ورودی جانبی Demo: Configure a Dataflow Pipeline with Side Input

  • دمو: راه‌اندازی و پیکربندی کلاستر Dataproc Demo: Set up and Configure a Dataproc Cluster

  • دمو: اجرای جاب پردازش دسته‌ای Spark در Dataproc Demo: Run a Spark Batch Processing Job on Dataproc

  • دمو: اجرای جاب Spark در Dataproc Serverless Demo: Run a Spark Job on Dataproc Serverless

  • دمو: راه‌اندازی Topic و Subscription در Pub/Sub Demo: Set up a Pub/Sub Topic and Subscription

  • دمو: پردازش جریانی پیام‌های Pub/Sub با استفاده از Dataflow Demo: Stream Processing Messages from Pub/Sub Using Dataflow

  • پنجره‌بندی (Windowing) در داده‌های جریانی Windowing on Streaming Data

  • انواع پنجره‌ها و انتخاب نوع مناسب Types of Windows and Choosing the Right Type

  • واترمارک‌ها (Watermarks) و داده‌های دیر رسیده Watermarks and Late Data

استقرار و عملیاتی‌سازی خط لوله‌های داده Deploying and Operationalizing Data Pipelines

  • ارکستراسیون گردش‌کارها با Cloud Composer Orchestrating Workflows Using Cloud Composer

  • ارکستراسیون گردش‌کارها با Cloud Workflows Orchestrating Workflows Using Cloud Workflows

  • انتخاب چارچوب ارکستراسیون مناسب Choosing the Right Orchestration Framework

  • پیاده‌سازی CI/CD در گوگل کلاود CI/CD on Google Cloud

آمادگی برای آزمون Exam Preparation

  • مباحث مهم برای آزمون Important Topics for the Exam

  • نمونه سوالات آزمون Examples of Exam Questions

نمایش نظرات

آموزش (GCP-PDE) جذب و پردازش داده‌ها
جزییات دوره
2h 41m
36
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.