آموزش مهندسی داده با Delta Lake در پلتفرم Databricks - آخرین آپدیت

دانلود Data Engineering with Delta Lake on Databricks

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: با استفاده از Delta Live Tables و معماری Medallion در Databricks، خط لوله‌های داده (Data Pipelines) آماده تولید بسازید. این دوره عملی به شما می‌آموزد که چگونه جریان‌های کاری ETL را طراحی، پیاده‌سازی و نظارت کنید تا داده‌های خام را از طریق یک الگوی لایه‌بندی ساختاریافته (Bronze-Silver-Gold)، به مجموعه‌داده‌های قابل اعتماد و آماده برای کسب‌وکار تبدیل کنید. این دوره عمدتاً برای دانشجویان سال اول و دوم رشته‌های مهندسی یا علوم و همچنین متخصصانی که به برنامه‌نویسی علاقه‌مند هستند، طراحی شده است. شما کار خود را با تسلط بر مبانی DLT شروع خواهید کرد؛ از جمله نحو (Syntax) خط لوله به صورت اعلامیه‌ای (Declarative) در SQL و Python، دریافت داده‌های جریانی با Auto Loader و استراتژی‌های تکامل طرحواره (Schema Evolution). در مرحله بعد، هر لایه از معماری Medallion را پیاده‌سازی خواهید کرد: لایه Bronze برای دریافت داده‌های خام با قابلیت ردیابی اصالت (Lineage)، لایه Silver برای پاکسازی داده‌ها با استفاده از گیت‌های کیفی مبتنی بر انتظارات (Expectations)، و لایه Gold برای محاسبات تجاری بهینه شده با استفاده از Z-ordering و پارتیشن‌بندی. دوره با یک پروژه نهایی به اوج خود می‌رسد که در آن یک سیستم مدیریت موجودی کامل را با استفاده از قابلیت Change Data Capture با متد `apply_changes()`، دریافت داده از منابع متعدد و مدیریت کامل خط لوله (Orchestration) می‌سازید. تمامی مفاهیم از طریق آزمایشگاه‌های عملی در Databricks Community Edition تقویت می‌شوند و نیازی به حساب کاربری پولی نیست. چه در حال انتقال از ETL دسته‌ای (Batch) به پردازش جریانی (Streaming) باشید و چه در حال ساخت اولین خط لوله Lakehouse خود، این دوره مهارت‌های عملی مورد نیاز کارفرمایان در نقش‌های مدرن مهندسی داده را به شما ارائه می‌دهد.

سرفصل ها و درس ها

مبانی DLT DLT Fundamentals

  • معرفی دوره Course Introduction

  • مقدمه Introduction

  • آشنایی با Delta Live Tables Introduction to Delta Live Tables

  • نحو DLT با استفاده از Python و SQL DLT Syntax with Python and SQL

  • ساخت اولین خط لوله DLT شما Creating Your First DLT Pipeline

  • خلاصه Summary

  • آشنایی با انتظارات کیفیت داده (Data Quality Expectations) Introduction to Data Quality Expectations

  • درک مفهوم انتظارات در DLT Understanding DLT Expectations

  • پیاده‌سازی انتظارات در خط لوله‌ها Implementing Expectations in Pipelines

  • خلاصه: اعمال انتظارات بر روی داده‌ها Summary: Applying Expectations to Data

  • آشنایی با پردازش داده‌های افزایشی (Incremental) Introduction to Incremental Data Processing

  • ایجاد جداول جریانی (Streaming Tables) Creating Streaming Tables

  • کار با جداول جریانی Working with Streaming Tables

  • طرحواره‌های خودکار و چالش‌های استریمینگ Automatic Schemas and Streaming Challenges

  • خلاصه: پردازش افزایشی و استریمینگ Summary: Incremental Processing and Streaming

معماری Medallion Medallion Architecture

  • آشنایی با لایه Bronze Introduction to the Bronze Layer

  • آشنایی با معماری Medallion Introduction to Medallion Architecture

  • الگوهای طراحی لایه Bronze Bronze Layer Design Patterns

  • دریافت داده‌ها در جداول Delta خام Ingesting Data to Raw Delta Tables

  • خلاصه: نرمال‌سازی و پاکسازی داده‌ها Summary: Normalizing and Cleaning Data

  • آشنایی با لایه Silver Introduction to the Silver Layer

  • تحلیل اکتشافی روی داده‌های خام Exploratory Analysis on Raw Data

  • استراتژی‌های کیفیت و پاکسازی داده‌ها Data Quality and Cleaning Strategies

  • بازبینی نتایج لایه Silver Reviewing Silver Layer Results

  • خلاصه: نرمال‌سازی و پاکسازی داده‌ها Summary: Normalizing and Cleaning Data

  • آشنایی با لایه Gold Introduction to the Gold Layer

  • اعمال منطق تجاری بر روی داده‌های پاکسازی شده Applying Business Logic to Clean Data

  • استراتژی‌های افزایشی و بازمحاسبه در خط لوله‌ها Incremental and Recompute Strategies in Pipelines

  • بهینه‌سازی برای جداول Gold Optimizations for Gold Tables

  • خلاصه: منطق تجاری و خروجی‌های لایه Gold Summary: Business Logic and Gold Layer Outputs

پروژه نهایی Capstone Project

  • آشنایی با اپلیکیشن لجستیک Introduction to the Logistics Application

  • مرور مدیریت موجودی (Inventory Orchestration) Overview of Inventory Orchestration

  • معماری Medallion در دنیای واقعی Real-World Medallion Architecture

  • مرور کلی خط لوله مدیریت موجودی Inventory Management Pipeline Overview

  • خلاصه: بازبینی کامل اپلیکیشن از ابتدا تا انتها Summary: End-to-End Application Review

  • آشنایی با چالش‌ها و گام‌های بعدی Introduction to Challenges and Next Steps

  • چالش‌ها و مسیر آینده در مهندسی داده Challenges and Next Steps in Data Engineering

  • خلاصه دوره: مهندسی داده با Databricks Course Summary: Data Engineering with Databricks

نمایش نظرات

آموزش مهندسی داده با Delta Lake در پلتفرم Databricks
جزییات دوره
2h 47m
38
(آخرین آپدیت)
718
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده