آموزش dbt در Databricks

دانلود dbt on Databricks

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: ساخت خطوط انتقال داده مقیاس‌پذیر، مدولار، آزمایش‌پذیر و کنترل‌شده با نسخه با dbt در Databricks تجربه عملی با dbt Cloud و dbt Core، از جمله راه‌اندازی، ارکستراسیون، و استقرار در سناریوهای دنیای واقعی به دست آورید. درک و پیاده‌سازی مدل‌ها، منابع و دانه‌های dbt در Databricks برای تبدیل داده‌های کارآمد. یاد بگیرید که از توابع و ماکروهای Jinja برای ایجاد کد SQL پویا و قابل استفاده مجدد در پروژه های dbt استفاده کنید. استاد ساختن جدول و بارگذاری افزایشی داده برای بهینه سازی گردش کار و عملکرد داده ها. برای اطمینان از کیفیت داده ها و شفافیت پروژه در dbt، روش های آزمایش و مستندسازی جامع را توسعه دهید. پیش نیازها: درک کامل Databricks از جمله Lakehouse Architecture آشنایی با دانش SQL Cloud Computing (اعم از Azure، GCP یا AWS) دسترسی به حساب پلتفرم ابری (اعم از Azure، GCP یا AWS) آگاهی از کنترل نسخه (اختیاری)

آیا آماده باز کردن پتانسیل کامل خطوط لوله تجزیه و تحلیل داده خود هستید؟ dbt on Databricks یک دوره آموزشی جامع است که برای متخصصان داده طراحی شده است که با هدف تسلط بر تبدیل داده ها با استفاده از dbt (ابزار ساخت داده) در پلت فرم Databricks، از قدرت Apache Spark برای گردش کار مقیاس پذیر و کارآمد استفاده می کند.


در حالی که Databricks قابلیت‌های پردازش داده قوی را ارائه می‌دهد، dbt تجربه را با ارائه چارچوبی برای تبدیل‌های مبتنی بر نسخه کنترل‌شده، ماژولار و قابل آزمایش مبتنی بر SQL افزایش می‌دهد. این ترکیب از قدرت Apache Spark برای گردش‌های کاری مقیاس‌پذیر استفاده می‌کند و در عین حال کدهای تمیزتر، قابل نگهداری‌تر و قابل استفاده مجدد را حفظ می‌کند.


این دوره هم dbt Cloud و هم dbt Core را پوشش می‌دهد و یادگیرندگان را با مهارت‌های همه‌کاره برای هر محیطی مجهز می‌کند.


آنچه این دوره شامل می شود:

  • مقدمه‌ای بر dbt و مفاهیم کلیدی: با یک مرور کلی از dbt، قالب‌سازی Jinja و YAML برای پیکربندی شروع کنید. درک کنید که چگونه این ابزارها برای ساده کردن تبدیل داده ها با هم ترکیب می شوند.

  • راه‌اندازی محیط: راهنمای گام به گام پیکربندی dbt Cloud با Databricks، ملزومات کنترل نسخه، و مقدمه‌ای بر اجزای اصلی و خطوط لوله داده را دنبال کنید.

  • مدل‌سازی و تبدیل داده‌ها: معماری داده‌های چند لایه، از جمله مدل‌های برنزی، نقره‌ای و طلایی را کاوش کنید. روش های عملی برای ارجاع منبع، پیکربندی طرحواره و ایجاد خطوط لوله داده کارآمد با استفاده از دستورات dbt بیاموزید.

  • آزمایش و اعتبارسنجی پیشرفته: بررسی‌های قوی کیفیت داده‌ها را از طریق آزمایش‌های عمومی و منفرد، انتقال از تست‌ها: syntax به data_tests: و ادغام بسته‌های dbt مانند dbt_utils برای عملکرد بهبودیافته، اجرا کنید.

  • Jinja، ماکروها و توابع سفارشی: بر هنر کدهای قابل استفاده مجدد و مقیاس پذیر با نحو و ماکروهای Jinja مسلط شوید. مهارت های دستکاری مدل های داده را به صورت پویا، تغییر طرحواره ها و توسعه منطق سفارشی برای موارد استفاده خاص به دست آورید.

  • مادی‌سازی‌ها توضیح داده شده: استراتژی‌های مختلف مادی‌سازی از جمله جداول، نماها، بارهای افزایشی و عکس‌های فوری را درک کنید. سناریوهای خاصی مانند SCD نوع 2 برای جداول ابعاد و به روز رسانی های افزایشی برای جداول واقعی را بررسی کنید.

  • استقرار و گردش کار تولید: یک محیط dbt آماده برای تولید بر روی Databricks راه اندازی کنید، مشاغل را مدیریت کنید و مدل ها را به طور یکپارچه اجرا کنید. پیکربندی محیط و متغیرهای هدف را برای گردش کار CI/CD ساده شده بیاموزید.

  • توسعه با dbt Core : انعطاف پذیری dbt Core را از طریق راه اندازی پروژه های محلی، ادغام GitHub و پیمایش خط فرمان، و در عین حال یادگیری بهترین شیوه ها برای کنترل نسخه و همکاری، تجربه کنید.

  • عیب‌یابی و تکنیک‌های پیشرفته: در مورد رسیدگی به مشکلات رایج اتصال، بهینه‌سازی عملکرد پروژه، و مقیاس‌بندی حجم‌های کاری در Databricks، بینشی به دست آورید.


مخاطب هدف:

این دوره برای مهندسان داده، تحلیلگران و معمارانی طراحی شده است که قبلاً با SQL آشنا هستند و می خواهند مهارت های خود را در تبدیل داده ها با استفاده از dbt در پلت فرم Databricks ارتقا دهند. دانش اولیه Python، Git و محیط های داده مبتنی بر ابر توصیه می شود.


چرا این دوره را بگذرانید؟

این دوره با پروژه‌های عملی، تمرین‌های هدایت‌شده، و منابع قابل دانلود، مهارت‌های عملی را ایجاد می‌کند که می‌تواند در چالش‌های داده‌های دنیای واقعی اعمال شود. در پایان دوره، مهارت در ساخت، آزمایش، و استقرار خطوط لوله داده قوی، یادگیرندگان را به عنوان متخصصان ماهر داده متمایز خواهد کرد که برای رسیدگی به جریان‌های کاری تجزیه و تحلیل پیچیده مجهز هستند.


سرفصل ها و درس ها

مقدمه Introduction

  • معرفی دوره Course Introduction

  • پیش نیازها Pre-requisites

  • dbt چیست؟ What is dbt?

  • جینجا چیست؟ What is Jinja?

  • YAML چیست؟ What is YAML?

  • DAG چیست؟ What is a DAG?

dbt Cloud معرفی و تنظیم منابع dbt Cloud Introduction and Resource Set Up

  • مدیریت هزینه و نیازهای منابع Cost Management and Resource Requirements

  • نحوه دریافت Databricks در نسخه آزمایشی رایگان How to get Databricks on Free Trials

  • الزامات فضای کاری Databricks Databricks Workspace Requirements

  • در حال بارگیری مجموعه داده خرده فروشی Loading the Retail Dataset

  • راه اندازی dbt Cloud و نمای کلی UI Setting up dbt Cloud and UI Overview

  • راه اندازی پروژه dbt Setting up the dbt Project

  • اجزای اصلی dbt Core Components of dbt

  • نسخه Git Control Essentials Git Version Control Essentials

مدل ها Models

  • مروری بر تحولات داده Overview of the Data Transformations

  • پیوند به ویکی دوره Link to Course Wiki

  • ابتدا به مدل های dbt نگاه کنید First Look at dbt Models

  • پاکسازی کد کامپایل شده Cleaning Compiled Code

  • مدل سازی لایه برنز و منابع Modelling the Bronze Layer and Sources

  • منبع طراوت Source Freshness

  • مدل سازی لایه نقره ای Modelling the Silver Layer

  • مدل سازی لایه طلا Modelling the Gold Layer

  • ساختار پوشه و قراردادهای نامگذاری Folder Structure and Naming Conventions

  • مقدمه ای بر ویژگی ها و تنظیمات Introduction to Properties and Configurations

  • پیکربندی طرحواره سفارشی Custom Schema Configuration

  • انتخاب گره Node Selection

تست های عمومی و منفرد Generic and Singular Tests

  • مروری بر آزمون های عمومی و منفرد Overview of Generic and Singular Tests

  • (FYI) "tests" در مقابل "data_tests": نام های مختلف، یک چیز (FYI) "tests" vs "data_tests": Different Names, Same Thing

  • تست های عمومی در منابع Generic Tests on Sources

  • تست های عمومی بر روی مدل ها Generic Tests on Models

  • تست های مفرد Singular Tests

  • ساخت dbt dbt build

بذرها و آنالیزها Seeds and Analyses

  • دانه ها Seeds

  • تجزیه و تحلیل می کند Analyses

Jinja، توابع، ماکروها و بسته ها Jinja, Functions, Macros and Packages

  • مقدمه ای بر نحو Jinja Introduction to Jinja Syntax

  • متغیرها در Jinja Variables in Jinja

  • IF شرط IF Condition

  • برای حلقه ها For Loops

  • توابع Functions

  • ماکروها Macros

  • بسته ها Packages

متریال سازی در dbt Materializations in dbt

  • مروری بر مادی سازی ها Overview of Materializations

  • جداول و نماها (خلاصه) Tables and Views (Recap)

  • جداول افزایشی (قسمت 1) Incremental Tables (Part 1)

  • جداول افزایشی (قسمت 2) Incremental Tables (Part 2)

  • عبارات جدول رایج (CTE) Common Table Expressions (CTEs)

  • زودگذر Ephemeral

  • عکس های فوری و SCD نوع 2 Snapshots and SCD Type 2

  • تنظیمات جدول خاص Databricks Databricks Specific Table Configurations

تست پیشرفته Advanced Testing

  • خلاصه و مرور کلی Recap and Overview

  • انتخاب آزمون Test Selection

  • تنظیمات تست اضافی Additional Test Configurations

  • تست های عمومی سفارشی Custom Generic Tests

  • تست با dbt_utils Testing with dbt_utils

  • تست با dbt_expectations Testing with dbt_expectations

  • مقدمه ای بر تست واحد در dbt Introduction to Unit Testing in dbt

  • نسخه آزمایشی واحد تست Unit Testing Demo

ادغام تغییرات ما در Main Merging our Changes to Main

  • ادغام تغییرات ما در Main Merging our Changes to Main

استقرار Deployment

  • محیط های استقرار Deployment Environments

  • ایجاد محیط تولید Creating a Production Environment

  • اولین کار استقرار ما Our First Deploy Job

  • اضافه کردن یک طرح فرود در کاتالوگ محصولات ما Adding a Landing Schema in our Prod Catalog

  • متغیرهای هدف Target Variables

  • متغیرهای محیطی Environment Variables

  • افزودن توضیحات به مستندات Adding Descriptions to the Documentation

  • قلاب Hooks

dbt Core dbt Core

  • dbt Core در مقابل dbt Cloud dbt Core vs dbt Cloud

  • بررسی اجمالی تنظیم محیط توسعه Development Environment Set Up Overview

  • حساب GitHub و Repo GitHub Account and Repo

  • نصب Git (ویندوز) Installing Git (Windows)

  • نصب پایتون (ویندوز) Installing Python (Windows)

  • نصب پایتون (MacOS) Installing Python (MacOS)

  • نصب و بررسی اجمالی کد ویژوال استودیو Visual Studio Code Installation and Overview

  • ناوبری خط فرمان Command Line Navigation

  • شبیه سازی مخزن GitHub ما و نسخه ی نمایشی جریان های کاری پایه GitHub Cloning our GitHub Repository and Demo of Basic GitHub Workflows

  • پیکربندی گواهی‌های SSL (macOS) Configuring SSL Certificates (macOS)

  • نصب dbt-core و dbt-databricks Installing dbt-core and dbt-databricks

  • راه اندازی پروژه هسته dbt ما Initializing our dbt Core Project

  • نسخه ی نمایشی هسته dbt - ساخت پروژه های dbt به صورت محلی dbt Core Demo - Building dbt Projects Locally

  • dbt Core Demo - افزودن محیط هدف Prod dbt Core Demo - Adding a Prod Target Environment

  • استفاده از dbt در گردش کار Databricks Using dbt in a Databricks Workflow

  • مروری بر برنامه افزودنی کاربر Power Power User Extension Overview

  • نسخه نمایشی برنامه افزودنی کاربر Power Power User Extension Demo

تبریک میگم Congratulations

  • آفرین برای تکمیل دوره! Well done on completing the course!

نمایش نظرات

آموزش dbt در Databricks
جزییات دوره
8 hours
84
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
366
4.8 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Malvik Vaghadia Malvik Vaghadia

مالویک بیش از 10 سال کار و مشاوره با تعدادی از شرکت های فهرست شده در لیست/لیست نشده به عنوان متخصص داده و BI را گذرانده است. در طول زندگی حرفه ای خود ، مالویک یک مهارت در تجزیه و تحلیل داده ها و تجسم ، با مهارت در مورد تعدادی از زبان های برنامه نویسی از جمله SQL ، Python و R. ایجاد کرده است. او به طور گسترده با تعدادی از سیستم عامل های نرم افزاری پیشرو از جمله Hadoop ، Oracle ، MySQL ، MS SQL Server ، Qlik و Microsoft Power Platforms. وی دارای تعدادی گواهینامه از جمله: · کارشناس راه حل های مجاز مایکروسافت: مدیریت داده و تجزیه و تحلیل · Microsoft Certified Solutions Associate: گزارشگری BI · مجوز Qlik Sense Data Architect