آموزش تسلط بر dbt (ابزار ساخت داده) - از مبتدی تا حرفه ای

Mastering dbt (Data Build Tool) - From Beginner to Pro

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: بوت کمپ مهندسی تجزیه و تحلیل عملی شامل تئوری، ساختن یک پروژه dbt از ابتدا، و استقرار در dbt Cloud نحوه ساخت یک پروژه کامل dbt از ابتدا مزایای اصلی dbt، و کمی پیشینه در مورد چگونگی به وجود آمدن آن اصول dbt: منابع، مدل‌ها، آزمایش‌ها، مستندات، عکس‌های فوری، دانه‌ها، ماکروها، قلاب‌ها و عملیات نحوه ساخت پروژه dbt: مدل‌های مرحله‌بندی، متوسط ​​و مارت - و قراردادهای نام‌گذاری نحوه کنترل نسخه تغییرات کد خود با GitHub و تست dbt پیشرفته VSCode - ایجاد تست‌های تکی و عمومی سفارشی خود، تنظیم شدت، و تنظیم آستانه‌های هشدار/خطا مدل‌سازی پیشرفته داده‌های dbt - از جمله مدل‌های افزایشی و زودگذر و نوع استفاده (و چه زمانی) دستورات پیشرفته dbt - نحوه استفاده متفاوت انتخابگرها، پروفایل های مختلف، تگ ها، انتخاب تست غیرمستقیم و ساخت سایت اسناد dbt محلی پیشرفته dbt jinja & macros - ایجاد ماکروهای خود برای استفاده در قلاب ها/توابع/عملیات، استفاده از jinja برای حلقه ها و متغیرها و تابع هدف نحوه استقرار پروژه شما در dbt Cloud، نحوه استفاده از dbt Cloud UI، و استفاده از متغیرهای محیطی نحوه استفاده از تست‌ها و ماکروها از بسته‌های خارجی برای شارژ کردن پروژه dbt بهترین روش‌های استفاده در هنگام اجرای پروژه dbt (بر اساس تجربه زیاد!) چگونه برای ایجاد یک راه اندازی کامل برای مک یا ویندوز: نصب همه ابزارها و دریافت تنظیمات VSCode خاص dbt! پیش نیازها: SQL پایه بدون نیاز به تجربه پایتون، ماشین مک/ویندوزی که قادر به نصب پایتون، گیت و VSCode است (ما در دوره همه اینها را اجرا خواهیم کرد!)

یک دوره آموزشی کامل برای کمک به هر کسی که مهارت های اولیه SQL را دارد، dbt پیشرفته را یاد بگیرد، ابزاری کلیدی برای مهندسی Analytics!

به دوره 2023 Mastering dbt (ابزار ساخت داده) خوش آمدید! این دوره همه چیز را از تئوری پشت dbt گرفته تا ساخت یک پروژه پیشرفته dbt (از ابتدا) و استقرار آن در dbt Cloud را در بر می گیرد.

من بیش از 7 سال تجربه در زمینه Analytics/Analytics Engineering/Data Science دارم، از جمله 4 سال استفاده از dbt به صورت روزانه. من همچنین در زمان حضورم در Monzo Bank درگیر عرضه dbt بودم!

در این دوره من همه چیزهایی را که در طول 4 سال گذشته آموخته ام و آنچه را که به صورت روزانه استفاده می کنم، مطالعه کرده ام و آن را فشرده کرده ام تا هر کسی که SQL را می داند در سریع ترین زمان ممکن به سطح پیشرفته dbt برسد.


به روز رسانی های دوره:

  • آوریل 2023: محتوای بیشتری برای راه اندازی با استفاده از PowerShell (Windows) اضافه شد

  • مه 2023: محتوای جدید - dbt نسخه 1.5 (منتشر شده آوریل 2023)

  • ژوئن 2023: برای تقویت آموخته هایمان، سخنرانی های خلاصه مرور کلی به همه بخش ها اضافه شد


رویکرد من به این دوره:

ما همه چیزهایی را که باید در مورد dbt بدانید را پوشش خواهیم داد: از مدل‌سازی داده‌های اولیه تا همه ویژگی‌های پیشرفته مانند ایجاد تست‌های سفارشی و ماکروها. ما این کار را گام به گام انجام می دهیم و از اصول اولیه به بالا می سازیم.

بر نتایج عملی متمرکز است - ما سن و سالی را صرف تئوری پایگاه داده نمی‌کنیم، یا وارد جزئیات زیادی در مجموعه داده‌های تجارت الکترونیکی که استفاده خواهیم کرد، نخواهیم بود، در عوض قصد داریم شما را به سطوح پیشرفته dbt برسانیم. در اسرع وقت.

برای هر ویدیویی که در آن کد می نویسیم، پیوست های درس را با خروجی های نهایی ایجاد کرده ام. این به این معنی است که می‌توانید در حین حرکت کدنویسی کنید، یا ویدیوها را تماشا کنید و پس از آن به جزوه‌ها نگاه کنید! من همچنین برخی از نظریه‌ها را با این جزوه‌ها گنجانده‌ام تا به بررسی نکات مطرح شده در ویدیوها کمک کنم.

همچنین یک مخزن عمومی GitHub (که برای این دوره از آن استفاده خواهید کرد) وجود دارد که شامل یک مدل پروژه نهایی است که می توانید در سراسر آن به آن مراجعه کنید.


این دوره ثابت نیست! مایلم نظرات شما را بشنوم و این دوره را به طور مداوم به روز می کنم.


ساختار دوره:

این دوره ابتدا بر درک درستی از مشکلاتی که dbt حل می‌کند، سپس ساخت یک پروژه اولیه dbt، قبل از لایه‌بندی مفاهیم پیشرفته‌تر و در نهایت پیاده‌سازی پروژه ما با dbt Cloud تمرکز دارد.


  1. مقدمه
    برخی از نظریه ها (<1 ساعت) در مورد dbt، چه مشکلاتی در پشته داده قبل از ظهور وجود داشت و چگونه آنها را حل می کند.


  2. راه اندازی ابزار
    راه اندازی با Python، GitHub، Google BigQuery، VSCode، و البته dbt! اگر قبلاً با هر یک از این ابزارها آشنایی دارید، می توانید از درس های مناسب صرف نظر کنید.

    ما همچنین مجموعه داده های تجارت الکترونیک خیالی را که در طول دوره استفاده خواهیم کرد، بررسی خواهیم کرد.


  3. ساختن پروژه اصلی dbt ما
    این بخش بر ایجاد پروژه ما از ابتدا تمرکز دارد، از جمله اینکه چگونه پروژه خود را ساختار خواهیم داد.

    ما مرحله بندی (stg)، متوسط ​​(int) را ایجاد خواهیم کرد. و مدل‌های داده‌های مارت، از جمله آزمایش مستندات با آزمایش‌های dbt خارج از جعبه.


  4. تست پیشرفته dbt
    ما شروع به ساختن بر روی پروژه اصلی dbt خود با تنظیم آستانه های شدت تست، استفاده از بسته های خارجی dbt-utils و dbt-expectations برای انتخاب عالی آنها از تست ها می کنیم، و کلی تکینگی سفارشی خود را ایجاد می کنیم. آزمایشات، و آزمایش تازگی داده های منبع ما.


  5. مدل‌سازی پیشرفته داده با dbt
    در مرحله بعد، نحوه ایجاد اسناد قابل استفاده مجدد، فایل‌های اولیه (فایل‌های .csv کنترل‌شده نسخه)، عکس‌های فوری (گرفتن تغییرات در جداول داده) و روش‌های تحقق را بررسی خواهیم کرد.

    بیشتر این بخش بر روی قسمت آخر متمرکز خواهد شد - روش های مادی سازی: زودگذر، نمایش، جدول و افزایشی. در این مرحله ما با مدل‌های جدول مشاهده مواجه خواهیم شد و هم یک مدل افزایشی و هم یک مدل زودگذر خواهیم ساخت - و شما متوجه خواهید شد که چه چیزی و چه زمانی باید استفاده کنید.

    [**جدید**] - این بخش همچنین محتوای جدید از dbt نسخه 1.5 را پوشش می دهد: قراردادهای داده، نسخه های مدل و دسترسی به مدل.


  6. دستورات پیشرفته dbt
    این بخش کمتر بر روی تغییر پروژه dbt ما تمرکز می کند، اما در عوض تمام دستورات اصلی dbt و نحوه (و زمان) استفاده از آنها را بررسی می کند.


  7. ماکروهای پیشرفته Jinja
    تغییرات نهایی در پروژه ما شامل استفاده از Jinja - یکی از ویژگی‌های اصلی dbt و احتمالاً پیچیده‌ترین اما قدرتمندترین ویژگی است - و استفاده از آن برای ایجاد ماکروهای خودمان است.

    این بخش نحوه استفاده از ماکروهای Jinja برای قلاب ها، عملیات و به عنوان توابع قابل استفاده مجدد در مدل های SQL خود را نشان می دهد. همچنین برخی از تئوری‌های مربوط به Jinja، اشتباهات رایج، و آنچه که من (شخصا) بیشتر برای آن مفید است را بررسی می‌کند!


  8. dbt Cloud
    در نهایت، نحوه اجرای پروژه خود و استقرار آن در dbt Cloud - از جمله نحوه برنامه ریزی برای اجرای منظم آن را بررسی خواهیم کرد. ما همچنین به خود dbt Cloud و مزایای اصلی آن نگاه خواهیم کرد.



سرفصل ها و درس ها

معرفی Introduction

  • معرفی مربی Instructor Introduction

  • طرح کلی دوره Course outline

  • معرفی دوره Course Introduction

  • تاریخچه مختصری از پشته داده A Brief History of the Data Stack

  • مزایای dbt - استنتاج وابستگی ها Benefits of dbt - Inferring Dependencies

  • مزایای dbt - مستندسازی و تست Benefits of dbt - Documentation & Testing

  • مزایای dbt - عملکردی شبیه پایتون Benefits of dbt - Python-Like Functionality

  • چگونه dbt بسیاری از مشکلات را در پشته داده حل کرده است How dbt Has Solved a Lot of Problems in the Data Stack

  • چگونه dbt در پشته داده قرار می گیرد How dbt Fits in the Data Stack

  • dbt Core در مقابل dbt Cloud dbt Core vs. dbt Cloud

  • خلاصه بخش Section Recap

راه اندازی با ابزار شما Getting Set Up with Your Tools

  • نمای کلی بخش Section Overview

  • اگر در طول این دوره گیر کردید کمک کنید Help if you get stuck during this course

  • ساخت اکانت جیمیل Creating a Gmail Account

  • راه اندازی یک پروژه BigQuery با صورتحساب Setting up a BigQuery Project With Billing

  • (اختیاری) اگر در صورت‌حساب BigQuery مشکل دارید (Optional) If You Have Issues With BigQuery Billing

  • رابط کاربری BigQuery The BigQuery UI

  • مجموعه داده ای که از آن استفاده خواهید کرد The Dataset You'll Be Using

  • (Mac) نصب پایتون 3.10 (Mac) Installing Python 3.10

  • (ویندوز) نصب پایتون 3.10 (Windows) Installing Python 3.10

  • دانلود VSCode و تنظیم میانبرها Downloading VSCode and Setting Up Shortcuts

  • ایجاد یک حساب کاربری GitHub Creating a GitHub account

  • فورکینگ در مقابل شبیه سازی Forking Vs. Cloning

  • چنگال کردن مخزن Forking the Repository

  • (اختیاری) اگر مشکلی در همگام سازی مخزن فورک شده خود دارید (Optional) If You Have Issues Syncing Your Forked Repository

  • نصب افزونه های پیشنهادی VSCode Installing the recommended VSCode Extensions

  • محیط مجازی (venv) چیست؟ What's a Virtual Environment (venv)?

  • راه اندازی محیط مجازی و نصب بسته ها Setting Up Our Virtual Environment and Installing Packages

  • راه اندازی dbt برای BigQuery Setting Up dbt for BigQuery

  • در حال آزمایش پروژه مدل dbt ما Trialling Our Model dbt Project

  • (اختیاری) تنظیم تکمیل خودکار dbt (Optional) Setting Up dbt Autocomplete

  • اجرای پروژه نهایی ما چگونه خواهد بود Run Through of How Our Final Project Will Look

  • خلاصه بخش Section Recap

ساخت پروژه پایه dbt Building the Basic dbt Project

  • نمای کلی بخش Section Overview

  • دستور init dbt The dbt init Command

  • کنترل نسخه با GitHub Version Control with GitHub

  • راه اندازی dbt Power User Setting up dbt Power User

  • چگونه پروژه خود را ساختار خواهیم داد How We'll Structure Our Project

  • ایجاد اولین منبع ما (src) فایل yml Creating Our First Source (src) yml File

  • (ویندوز) مشکلات پسوند dbt Power User (Windows) Issues with the dbt Power User extension

  • ایجاد اولین مرحله بندی (stg) مدل SQL ما Creating Our First Staging (stg) SQL Model

  • اجرای اولین مرحله بندی (stg) مدل SQL ما Running Our First Staging (stg) SQL Model

  • ایجاد اولین فایل yml مدل ما Creating Our First Model yml File

  • افزودن تست ها به فایل yml مدل اول ما Adding Tests to Our First Model yml File

  • مدل‌های خود را به گونه‌ای تنظیم می‌کنیم که به‌جای نماها، به‌عنوان جداول درآیند Setting Up Our Models to Materialise as Tables Instead of Views

  • راه اندازی بقیه مدل های SQL (stg) ما Getting the Rest of Our Staging (stg) SQL Models Set Up

  • استفاده از dbt clean برای کار کردن با متریال سازی جدول Using dbt clean to Get Table Materialisation Working

  • راه اندازی بقیه فایل های مرحله بندی (stg) yml Getting the Rest of the Staging (stg) yml Files Set Up

  • بررسی مدل‌های داده‌های مرحله‌بندی (stg) ما Taking Stock of Our Staging (stg) Data Models

  • پوشه هدف The Target Folder

  • راه اندازی اولین مدل SQL متوسط ​​(int) ما Getting Our First Intermediate (int) SQL Model Set Up

  • راه اندازی اولین فایل yml متوسط ​​(int) ما Getting Our First Intermediate (int) yml File Set Up

  • راه اندازی مدل Mart SQL ما Getting Our Mart SQL Model Set Up

  • راه اندازی فایل Mart yml ما Getting Our Mart yml File Set Up

  • پروژه پایه dbt ما اکنون کامل شده است! Our Basic dbt Project Is Now Complete!

  • خلاصه بخش Section Recap

dbt پیشرفته: تست Advanced dbt: Testing

  • نمای کلی بخش Section Overview

  • تنظیم شدت تست پیش فرض Setting Default Test Severity

  • تنظیم شدت آزمون و آستانه Setting Test Severity and Thresholds

  • بسته های خارجی dbt که ما استفاده خواهیم کرد The External dbt Packages We'll Be Using

  • dbt_utils و dbt_expectations dbt_utils and dbt_expectations

  • تست های منفرد سفارشی Custom Singular Tests

  • تست های عمومی سفارشی Custom Generic Tests

  • استفاده از تست های پیشرفته برای کل پروژه ما Applying Advanced Tests to Our Whole Project

  • منبع تست های تازگی Source Freshness Tests

  • خلاصه بخش Section Recap

dbt پیشرفته: مدل سازی داده ها Advanced dbt: Data Modelling

  • نمای کلی بخش Section Overview

  • تابع doc The doc Function

  • فایل های بذر Seed Files

  • عکس های فوری dbt dbt Snapshots

  • انواع متریال سازی Materialisation Types

  • متریال سازی: مدل های زودگذر Materialisation: Ephemeral Models

  • تحقق: مدل‌های افزایشی Materialisation: Incremental Models

  • (اختیاری) پارتیشن بندی جدول در BigQuery (Optional) Partitioning a Table in BigQuery

  • [جدید] - پیش نمایش dbt Core نسخه 1.5 [NEW] - Preview of dbt Core Version 1.5

  • [جدید] - (پیش نمایش) دسترسی به مدل [NEW] - (Preview) Model Access

  • [جدید] - (پیش نمایش) قراردادهای داده [NEW] - (Preview) Data Contracts

  • [جدید] - (پیش نمایش) نسخه های مدل [NEW] - (Preview) Model Versions

  • خلاصه بخش Section Recap

dbt پیشرفته: دستورات و انتخابگرها Advanced dbt: Commands and Selectors

  • نمای کلی بخش Section Overview

  • دستورات برای اجرای تمیز dbt Commands For a Clean dbt run

  • استفاده از پروفایل های مختلف dbt Using Different dbt Profiles

  • انتخابگرها Selectors

  • برچسب ها Tags

  • انتخاب آزمون غیر مستقیم Indirect Test Selection

  • تست dbt با --warn-error dbt test With --warn-error

  • ساخت dbt dbt build

  • اسناد dbt تولید/سرویس می کنند dbt docs generate / serve

  • خلاصه بخش Section Recap

dbt پیشرفته: Jinja و Macros Advanced dbt: Jinja and Macros

  • نمای کلی بخش Section Overview

  • نظرات، اظهارات و عبارات Jinja Jinja Comments, Statements, and Expressions

  • 3 نوع ماکرو: توابع، قلاب، عملیات The 3 Types of Macro: Functions, Hooks, Operations

  • (اختیاری) مرجع تابع dbt Jinja (Optional) dbt Jinja Function Reference

  • ماکروها: عملیات Macros: Operations

  • ماکروها: توابع (ساخت یک کلان پایه) Macros: Functions (Building a Basic Macro)

  • ماکروها: قلاب Macros: Hooks

  • عبارات Jinja: برای حلقه ها و تنظیم متغیرها Jinja Statements: for Loops and Setting Variables

  • (اختیاری) Jinja: با استفاده از تابع هدف (Optional) Jinja: Using the Target Function

  • خلاصه بخش Section Recap

dbt ابر dbt Cloud

  • نمای کلی بخش Section Overview

  • ایجاد یک حساب dbt Cloud Creating a dbt Cloud Account

  • راه اندازی یک حساب خدمات Setting Up a Service Account

  • اتصال GitHub به dbt Cloud Connecting GitHub to dbt Cloud

  • dbt Cloud IDE The dbt Cloud IDE

  • استقرار Jobs در dbt Cloud Deploying Jobs on dbt Cloud

  • خلاصه بخش Section Recap

نمایش نظرات

آموزش تسلط بر dbt (ابزار ساخت داده) - از مبتدی تا حرفه ای
جزییات دوره
7 hours
106
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
464
4.5 از 5
دارد
دارد
دارد
Jack Colsey
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jack Colsey Jack Colsey

مدیر تجزیه و تحلیل با بیش از 7 سال تجربه در داده