آموزش (GCP-PDE) جمع‌آوری و پردازش داده‌ها - آخرین آپدیت

دانلود (GCP-PDE) Ingesting and Processing the Data

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: سازمان‌ها به‌طور فزاینده‌ای برای مدیریت منابع داده متنوع، نیازهای جمع‌آوری لحظه‌ای (Real-time) و انتظارات رو به رشد برای داشتن داده‌های پاک و قابل اعتماد با چالش روبرو هستند؛ موضوعی که طراحی دقیق خطوط لوله داده (Data Pipelines) را ضروری می‌کند. در این دوره آموزشی با عنوان «(GCP-PDE) جمع‌آوری و پردازش داده‌ها»، شما توانایی ساخت خطوط لوله مقیاس‌پذیر دسته‌ای (Batch) و جریانی (Streaming) را کسب خواهید کرد تا کیفیت داده‌ها و آمادگی آن‌ها برای تحلیل‌های پایین‌دستی تضمین شود. ابتدا، نحوه برنامه‌ریزی خطوط لوله داده را از طریق درک منابع (Sources)، مقصدهای ذخیره‌سازی (Sinks)، منطق تبدیل، مبانی شبکه و استراتژی‌های رمزنگاری بررسی خواهید کرد. سپس، روش‌های ساخت این خطوط لوله را با استفاده از سرویس‌های Google Cloud از جمله Dataflow، Pub/Sub، BigQuery، Cloud Data Fusion و سایر ابزارها، هم به صورت کدنویسی و هم بدون کد (No-code) خواهید آموخت. در نهایت، نحوه استقرار و عملیاتی‌سازی خطوط لوله خود را با Cloud Composer، Cloud Workflows، CI/CD و زیرساخت به عنوان کد (IaC) فرا خواهید گرفت. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم در زمینه جمع‌آوری و پردازش داده‌های گوگل کلاود را برای ایجاد خطوط لوله قابل اعتماد، مقیاس‌پذیر و آماده تولید (Production-ready) به‌دست آورده و آماده پاسخگویی به این مباحث در آزمون گواهینامه Professional Data Engineer خواهید بود.

سرفصل ها و درس ها

برنامه‌ریزی خطوط لوله داده Planning Data Pipelines

  • نیازمندی‌های سیستم و نرم‌افزاری System and Software Requirements

  • پردازش دسته‌ای و جریانی Batch and Stream Processing

  • خطوط لوله داده و چارچوب‌های ارکستراسیون Data Pipelines and Orchestration Frameworks

  • خطوط لوله دسته‌ای در گوگل کلاود Batch Pipelines on Google Cloud

  • مقایسه خطوط لوله ETL و ELT ETL vs. ELT Pipelines

  • پردازش جریانی در گوگل کلاود Stream Processing on Google Cloud

  • رویکردهای ترکیبی ETL و ELT و انتخاب گزینه مناسب Hybrid ETL and ELT Approaches and Choosing the Right Pipeline Option

  • خطوط لوله بدون سرور با Dataflow Serverless Pipelines with Dataflow

  • تبدیلات اصلی داده‌ها Core Data Transforms

  • مفاهیم پیشرفته Dataflow: ورودی‌های جانبی، خروجی‌های جانبی و جداول Dead Letter Advanced Dataflow Concepts Side Inputs Side Outputs Dead Letter Tables

  • مفاهیم پیشرفته Dataflow: ادغام (Fusion) و جداسازی (Unfusion) Advanced Dataflow Concepts Fusion and Unfusion

  • قالب‌ها و فلگ‌های Dataflow Dataflow Templates and Dataflow Flags

  • گردش‌های کاری هدوپ با Dataproc Hadoop Workflows with Dataproc

  • استریمینگ Spark با Dataproc Serverless Spark Streaming with Dataproc Serverless

  • انتخاب سرویس مناسب برای پردازش داده‌ها Choosing the Right Data Processing Service

  • استریمینگ با Pub/Sub Streaming with Pub/Sub

  • مفاهیم کلیدی Pub/Sub Key Pub/Sub Concepts

ساخت خطوط لوله داده Building Data Pipelines

  • پاک‌سازی داده‌ها با DataPrep Data Cleansing with DataPrep

  • دمو: پیکربندی خط لوله Dataflow برای پردازش دسته‌ای Demo: Configure a Dataflow Pipeline for Batch Processing

  • دمو: اجرای خط لوله دسته‌ای روی Dataflow Demo: Running a Batch Pipeline on Dataflow

  • دمو: پیکربندی خط لوله Dataflow با خروجی جانبی Demo: Configure a Dataflow Pipeline with Side Output

  • دمو: پیکربندی خط لوله Dataflow با ورودی جانبی Demo: Configure a Dataflow Pipeline with Side Input

  • دمو: راه‌اندازی و پیکربندی کلاستر Dataproc Demo: Set up and Configure a Dataproc Cluster

  • دمو: اجرای یک جاب پردازش دسته‌ای Spark روی Dataproc Demo: Run a Spark Batch Processing Job on Dataproc

  • دمو: اجرای جاب Spark روی Dataproc Serverless Demo: Run a Spark Job on Dataproc Serverless

  • دمو: راه‌اندازی Topic و Subscription در Pub/Sub Demo: Set up a Pub/Sub Topic and Subscription

  • دمو: پردازش جریانی پیام‌های Pub/Sub با استفاده از Dataflow Demo: Stream Processing Messages from Pub/Sub Using Dataflow

  • پنجره‌بندی (Windowing) در داده‌های جریانی Windowing on Streaming Data

  • انواع پنجره‌ها و انتخاب نوع مناسب Types of Windows and Choosing the Right Type

  • واترمارک‌ها (Watermarks) و داده‌های دیررس Watermarks and Late Data

استقرار و عملیاتی‌سازی خطوط لوله داده Deploying and Operationalizing Data Pipelines

  • ارکستراسیون گردش‌های کاری با Cloud Composer Orchestrating Workflows Using Cloud Composer

  • ارکستراسیون گردش‌های کاری با Cloud Workflows Orchestrating Workflows Using Cloud Workflows

  • انتخاب چارچوب ارکستراسیون مناسب Choosing the Right Orchestration Framework

  • پیاده‌سازی CI/CD در گوگل کلاود CI/CD on Google Cloud

آمادگی برای آزمون Exam Preparation

  • مباحث مهم برای آزمون Important Topics for the Exam

  • نمونه سوالات آزمون Examples of Exam Questions

نمایش نظرات

آموزش (GCP-PDE) جمع‌آوری و پردازش داده‌ها
جزییات دوره
2h 41m
36
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.