لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش (GCP-PDE) جمعآوری و پردازش دادهها
- آخرین آپدیت
دانلود (GCP-PDE) Ingesting and Processing the Data
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
سازمانها بهطور فزایندهای برای مدیریت منابع داده متنوع، نیازهای جمعآوری لحظهای (Real-time) و انتظارات رو به رشد برای داشتن دادههای پاک و قابل اعتماد با چالش روبرو هستند؛ موضوعی که طراحی دقیق خطوط لوله داده (Data Pipelines) را ضروری میکند. در این دوره آموزشی با عنوان «(GCP-PDE) جمعآوری و پردازش دادهها»، شما توانایی ساخت خطوط لوله مقیاسپذیر دستهای (Batch) و جریانی (Streaming) را کسب خواهید کرد تا کیفیت دادهها و آمادگی آنها برای تحلیلهای پاییندستی تضمین شود. ابتدا، نحوه برنامهریزی خطوط لوله داده را از طریق درک منابع (Sources)، مقصدهای ذخیرهسازی (Sinks)، منطق تبدیل، مبانی شبکه و استراتژیهای رمزنگاری بررسی خواهید کرد. سپس، روشهای ساخت این خطوط لوله را با استفاده از سرویسهای Google Cloud از جمله Dataflow، Pub/Sub، BigQuery، Cloud Data Fusion و سایر ابزارها، هم به صورت کدنویسی و هم بدون کد (No-code) خواهید آموخت. در نهایت، نحوه استقرار و عملیاتیسازی خطوط لوله خود را با Cloud Composer، Cloud Workflows، CI/CD و زیرساخت به عنوان کد (IaC) فرا خواهید گرفت. پس از اتمام این دوره، شما مهارتها و دانش لازم در زمینه جمعآوری و پردازش دادههای گوگل کلاود را برای ایجاد خطوط لوله قابل اعتماد، مقیاسپذیر و آماده تولید (Production-ready) بهدست آورده و آماده پاسخگویی به این مباحث در آزمون گواهینامه Professional Data Engineer خواهید بود.
سرفصل ها و درس ها
برنامهریزی خطوط لوله داده
Planning Data Pipelines
نیازمندیهای سیستم و نرمافزاری
System and Software Requirements
پردازش دستهای و جریانی
Batch and Stream Processing
خطوط لوله داده و چارچوبهای ارکستراسیون
Data Pipelines and Orchestration Frameworks
خطوط لوله دستهای در گوگل کلاود
Batch Pipelines on Google Cloud
مقایسه خطوط لوله ETL و ELT
ETL vs. ELT Pipelines
پردازش جریانی در گوگل کلاود
Stream Processing on Google Cloud
رویکردهای ترکیبی ETL و ELT و انتخاب گزینه مناسب
Hybrid ETL and ELT Approaches and Choosing the Right Pipeline Option
خطوط لوله بدون سرور با Dataflow
Serverless Pipelines with Dataflow
تبدیلات اصلی دادهها
Core Data Transforms
مفاهیم پیشرفته Dataflow: ورودیهای جانبی، خروجیهای جانبی و جداول Dead Letter
Advanced Dataflow Concepts Side Inputs Side Outputs Dead Letter Tables
مفاهیم پیشرفته Dataflow: ادغام (Fusion) و جداسازی (Unfusion)
Advanced Dataflow Concepts Fusion and Unfusion
قالبها و فلگهای Dataflow
Dataflow Templates and Dataflow Flags
گردشهای کاری هدوپ با Dataproc
Hadoop Workflows with Dataproc
استریمینگ Spark با Dataproc Serverless
Spark Streaming with Dataproc Serverless
انتخاب سرویس مناسب برای پردازش دادهها
Choosing the Right Data Processing Service
استریمینگ با Pub/Sub
Streaming with Pub/Sub
مفاهیم کلیدی Pub/Sub
Key Pub/Sub Concepts
ساخت خطوط لوله داده
Building Data Pipelines
پاکسازی دادهها با DataPrep
Data Cleansing with DataPrep
دمو: پیکربندی خط لوله Dataflow برای پردازش دستهای
Demo: Configure a Dataflow Pipeline for Batch Processing
دمو: اجرای خط لوله دستهای روی Dataflow
Demo: Running a Batch Pipeline on Dataflow
دمو: پیکربندی خط لوله Dataflow با خروجی جانبی
Demo: Configure a Dataflow Pipeline with Side Output
دمو: پیکربندی خط لوله Dataflow با ورودی جانبی
Demo: Configure a Dataflow Pipeline with Side Input
دمو: راهاندازی و پیکربندی کلاستر Dataproc
Demo: Set up and Configure a Dataproc Cluster
دمو: اجرای یک جاب پردازش دستهای Spark روی Dataproc
Demo: Run a Spark Batch Processing Job on Dataproc
دمو: اجرای جاب Spark روی Dataproc Serverless
Demo: Run a Spark Job on Dataproc Serverless
دمو: راهاندازی Topic و Subscription در Pub/Sub
Demo: Set up a Pub/Sub Topic and Subscription
دمو: پردازش جریانی پیامهای Pub/Sub با استفاده از Dataflow
Demo: Stream Processing Messages from Pub/Sub Using Dataflow
پنجرهبندی (Windowing) در دادههای جریانی
Windowing on Streaming Data
انواع پنجرهها و انتخاب نوع مناسب
Types of Windows and Choosing the Right Type
واترمارکها (Watermarks) و دادههای دیررس
Watermarks and Late Data
استقرار و عملیاتیسازی خطوط لوله داده
Deploying and Operationalizing Data Pipelines
ارکستراسیون گردشهای کاری با Cloud Composer
Orchestrating Workflows Using Cloud Composer
ارکستراسیون گردشهای کاری با Cloud Workflows
Orchestrating Workflows Using Cloud Workflows
انتخاب چارچوب ارکستراسیون مناسب
Choosing the Right Orchestration Framework
پیادهسازی CI/CD در گوگل کلاود
CI/CD on Google Cloud
آمادگی برای آزمون
Exam Preparation
مباحث مهم برای آزمون
Important Topics for the Exam
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات