آموزش دریاچه دلتا با Azure Databricks: Deep Dive

Delta Lake with Azure Databricks: Deep Dive

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: در این دوره آموزشی، در مورد دریاچه دلتا با استفاده از Azure Databricks و اکوسیستم آن – Delta Lake Storage، Delta Engine، Delta Architecture، Delta Live Tables و غیره – و نحوه ارائه ویژگی های انبار مانندی که می توانید از آنها برای ساختن یک انبار استفاده کنید، یاد خواهید گرفت. ...Delta Lake یک لایه ذخیره‌سازی منبع باز است که با ارائه ویژگی‌های انبار داده در بالای Data Lake، قابلیت اطمینان را برای Data Lakes به ارمغان می‌آورد. این اکوسیستم بزرگی دارد و ابزارها و معماری‌های مختلفی بر اساس آن وجود دارد - Delta Lake Storage، Delta Engine، Delta Architecture، Delta Live Tables، Delta Sharing و غیره. همچنین می‌تواند داده‌های دسته‌ای و جریانی را به‌طور یکپارچه مدیریت کند. و این مولفه ها و ویژگی ها می توانند به شما در ساخت یک معماری بهینه و یکپارچه Lakehouse کمک کنند. در این دوره، دریاچه دلتا با Azure Databricks: Deep Dive، خواهید آموخت که چگونه دریاچه دلتا و اجزای مختلف در اکوسیستم آن، به ما اجازه می دهد تا یک معماری Lakehouse بسازیم. و برای انجام این کار، از Azure Databricks استفاده خواهیم کرد. ابتدا، خواهید آموخت که دریاچه دلتا چیست و چگونه کار می کند. همچنین اجزای مختلف را در اکوسیستم آن خواهید دید. سپس، نحوه کار با ذخیره سازی Delta Lake و ویژگی های مختلف آن را خواهید فهمید. در مرحله بعد، نحوه مدیریت داده های جریانی در دریاچه دلتا را خواهید دید. پس از آن، Delta Engine را در Databricks برای بهینه‌سازی فضای ذخیره‌سازی و پرس و جوها بررسی خواهید کرد. به دنبال این، خواهید دید که چگونه یک معماری Lakehouse بسازید. و همچنین خواهید دید که چگونه می توانید خطوط لوله قابل اعتماد ETL را با جداول زنده دلتا بسازید. در نهایت، شما با برخی موارد استفاده رایج و نحوه اجرای آنها پایان خواهید داد. در پایان این دوره، دانش و مهارت لازم برای کار با Delta Lake و استفاده از اجزای اکوسیستم آن برای ایجاد یک راه حل بهینه و یکپارچه Lakehouse را خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

شروع کار با دریاچه دلتا Getting Started with Delta Lake

  • معرفی دوره Course Introduction

  • نیاز به دریاچه دلتا Need for Delta Lake

  • دریاچه دلتا چگونه کار می کند؟ How Does Delta Lake Work?

  • ضمانت اسید در دریاچه دلتا ACID Guarantees on Delta Lake

  • آشنایی با اکوسیستم دلتا Understanding Delta Ecosystem

  • راه اندازی Azure Databricks Environment Setting up Azure Databricks Environment

  • خلاصه Summary

کار با Delta Lake Storage Working with Delta Lake Storage

  • نمای کلی ماژول Module Overview

  • ذخیره سازی داده ها در قالب دلتا Storing Data in Delta Format

  • ایجاد جدول دلتا Creating Delta Table

  • درج داده ها به جدول دلتا Inserting Data to Delta Table

  • انجام عملیات DML: به روز رسانی/حذف/ادغام Performing DML Operations: Update / Delete / Merge

  • اجرای طرحواره و تکامل Schema Enforcement and Evolution

  • اعمال محدودیت های جدول Applying Table Constraints

  • دسترسی به داده ها با سفر در زمان Accessing Data with Time Travel

  • خلاصه Summary

مدیریت داده های جریان در دریاچه دلتا Handling Streaming Data on Delta Lake

  • نمای کلی ماژول Module Overview

  • درک جریان در دریاچه دلتا Understanding Streaming on Delta Lake

  • راه اندازی محیط جریان Setting up Streaming Environment

  • ساخت خط لوله جریان با دریاچه دلتا Building Streaming Pipeline with Delta Lake

  • به روز رسانی جدول دلتا با داده های جریانی Updating Delta Table with Streaming Data

  • بازرسی گزارش تراکنش Transaction Log Checkpointing

  • مدیریت همزمانی Handling Concurrency

  • نسخه ی نمایشی: مدیریت همزمانی Demo: Handling Concurrency

  • خلاصه Summary

بهینه سازی با موتور دلتا در Databricks Optimizing with Delta Engine in Databricks

  • نمای کلی ماژول Module Overview

  • آشنایی با موتور دلتا Understanding Delta Engine

  • بهبود عملکرد با آمار و پرش داده ها Improving Performance with Statistics and Data Skipping

  • بهینه سازی جدول دلتا با ترتیب Z Optimizing & Z-ordering Delta Table

  • تمیز کردن فایل ها با جاروبرقی Cleaning Files with Vacuum

  • فعال کردن بهینه سازی خودکار در جدول دلتا Enabling Auto Optimization on Delta Table

  • کار با Photon Execution Engine Working with Photon Execution Engine

  • استفاده از دلتا کش Using Delta Cache

  • خلاصه Summary

ساخت یک معماری Lakehouse Building a Lakehouse Architecture

  • نمای کلی ماژول Module Overview

  • آشنایی با معماری لیک هاوس Understanding Lakehouse Architecture

  • Inside Lakehouse: Understanding Delta Architecture Inside Lakehouse: Understanding Delta Architecture

  • استفاده از Change Data Feed Using Change Data Feed

  • معماری دلتا: با فید داده تغییر دسته ای داده Delta Architecture: With Batch Data & Change Data Feed

  • خلاصه Summary

ساخت خطوط لوله ETL با جداول زنده دلتا Building ETL Pipelines with Delta Live Tables

  • نمای کلی ماژول Module Overview

  • آشنایی با جداول زنده دلتا Understanding Delta Live Tables

  • ساخت خط لوله ETL ساده با جداول زنده دلتا Building Simple ETL Pipeline with Delta Live Tables

  • خط لوله ETL افزایشی مجتمع ساختمانی Building Complex & Incremental ETL Pipeline

  • خلاصه Summary

اجرای موارد استفاده مشترک Implementing Common Use Cases

  • نمای کلی ماژول Module Overview

  • جست و جوی جداول دلتا با تجزیه و تحلیل Azure Synapse Querying Delta Tables with Azure Synapse Analytics

  • مصرف جداول دلتا در Power BI Consuming Delta Tables in Power BI

  • خلاصه دوره Course Summary

نمایش نظرات

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.

آموزش دریاچه دلتا با Azure Databricks: Deep Dive
جزییات دوره
3h 35m
50
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
26
4.7 از 5
دارد
دارد
دارد
Mohit Batra
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mohit Batra Mohit Batra

موهیت یک مهندس داده ، یک مربی مجوز مایکروسافت (MCT) و یک مشاور است. موهیت دارای بیش از 15 سال تجربه گسترده در زمینه راهکارهای مقیاس بزرگ هوش تجاری ، ذخیره سازی داده ها و راه حل های بزرگ داده با شرکت هایی مانند مایکروسافت و برخی از بانک های پیشرو سرمایه گذاری است. موهیت به عنوان یک متخصص در زمینه خود ، اغلب دانش خود را در Azure ، Spark ، SQL Server و Power BI در تالارهای گفتگوی عمومی مختلف و به عنوان یک مربی شریک کرده است. محیط واقعاً عاشق تدریس است و از تولید مواد یادگیری جذاب و با کیفیت برای جلسات خود لذت می برد. در اوقات فراغت ، موهیت عاشق کتاب خواندن است ، از عکاسی و موسیقی لذت می برد.