لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مهندسی داده با Delta Lake در پلتفرم Databricks
- آخرین آپدیت
دانلود Data Engineering with Delta Lake on Databricks
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
با استفاده از Delta Live Tables و معماری Medallion در Databricks، خط لولههای داده (Data Pipelines) آماده تولید بسازید. این دوره عملی به شما میآموزد که چگونه جریانهای کاری ETL را طراحی، پیادهسازی و نظارت کنید تا دادههای خام را از طریق یک الگوی لایهبندی ساختاریافته (Bronze-Silver-Gold)، به مجموعهدادههای قابل اعتماد و آماده برای کسبوکار تبدیل کنید.
این دوره عمدتاً برای دانشجویان سال اول و دوم رشتههای مهندسی یا علوم و همچنین متخصصانی که به برنامهنویسی علاقهمند هستند، طراحی شده است.
شما کار خود را با تسلط بر مبانی DLT شروع خواهید کرد؛ از جمله نحو (Syntax) خط لوله به صورت اعلامیهای (Declarative) در SQL و Python، دریافت دادههای جریانی با Auto Loader و استراتژیهای تکامل طرحواره (Schema Evolution). در مرحله بعد، هر لایه از معماری Medallion را پیادهسازی خواهید کرد: لایه Bronze برای دریافت دادههای خام با قابلیت ردیابی اصالت (Lineage)، لایه Silver برای پاکسازی دادهها با استفاده از گیتهای کیفی مبتنی بر انتظارات (Expectations)، و لایه Gold برای محاسبات تجاری بهینه شده با استفاده از Z-ordering و پارتیشنبندی.
دوره با یک پروژه نهایی به اوج خود میرسد که در آن یک سیستم مدیریت موجودی کامل را با استفاده از قابلیت Change Data Capture با متد `apply_changes()`، دریافت داده از منابع متعدد و مدیریت کامل خط لوله (Orchestration) میسازید. تمامی مفاهیم از طریق آزمایشگاههای عملی در Databricks Community Edition تقویت میشوند و نیازی به حساب کاربری پولی نیست.
چه در حال انتقال از ETL دستهای (Batch) به پردازش جریانی (Streaming) باشید و چه در حال ساخت اولین خط لوله Lakehouse خود، این دوره مهارتهای عملی مورد نیاز کارفرمایان در نقشهای مدرن مهندسی داده را به شما ارائه میدهد.
سرفصل ها و درس ها
مبانی DLT
DLT Fundamentals
معرفی دوره
Course Introduction
مقدمه
Introduction
آشنایی با Delta Live Tables
Introduction to Delta Live Tables
نحو DLT با استفاده از Python و SQL
DLT Syntax with Python and SQL
ساخت اولین خط لوله DLT شما
Creating Your First DLT Pipeline
خلاصه
Summary
آشنایی با انتظارات کیفیت داده (Data Quality Expectations)
Introduction to Data Quality Expectations
درک مفهوم انتظارات در DLT
Understanding DLT Expectations
پیادهسازی انتظارات در خط لولهها
Implementing Expectations in Pipelines
خلاصه: اعمال انتظارات بر روی دادهها
Summary: Applying Expectations to Data
آشنایی با پردازش دادههای افزایشی (Incremental)
Introduction to Incremental Data Processing
ایجاد جداول جریانی (Streaming Tables)
Creating Streaming Tables
کار با جداول جریانی
Working with Streaming Tables
طرحوارههای خودکار و چالشهای استریمینگ
Automatic Schemas and Streaming Challenges
خلاصه: پردازش افزایشی و استریمینگ
Summary: Incremental Processing and Streaming
معماری Medallion
Medallion Architecture
آشنایی با لایه Bronze
Introduction to the Bronze Layer
آشنایی با معماری Medallion
Introduction to Medallion Architecture
الگوهای طراحی لایه Bronze
Bronze Layer Design Patterns
دریافت دادهها در جداول Delta خام
Ingesting Data to Raw Delta Tables
خلاصه: نرمالسازی و پاکسازی دادهها
Summary: Normalizing and Cleaning Data
آشنایی با لایه Silver
Introduction to the Silver Layer
تحلیل اکتشافی روی دادههای خام
Exploratory Analysis on Raw Data
استراتژیهای کیفیت و پاکسازی دادهها
Data Quality and Cleaning Strategies
نمایش نظرات