لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش dbt در Databricks
دانلود dbt on Databricks
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
ساخت خطوط انتقال داده مقیاسپذیر، مدولار، آزمایشپذیر و کنترلشده با نسخه با dbt در Databricks تجربه عملی با dbt Cloud و dbt Core، از جمله راهاندازی، ارکستراسیون، و استقرار در سناریوهای دنیای واقعی به دست آورید. درک و پیادهسازی مدلها، منابع و دانههای dbt در Databricks برای تبدیل دادههای کارآمد. یاد بگیرید که از توابع و ماکروهای Jinja برای ایجاد کد SQL پویا و قابل استفاده مجدد در پروژه های dbt استفاده کنید. استاد ساختن جدول و بارگذاری افزایشی داده برای بهینه سازی گردش کار و عملکرد داده ها. برای اطمینان از کیفیت داده ها و شفافیت پروژه در dbt، روش های آزمایش و مستندسازی جامع را توسعه دهید. پیش نیازها: درک کامل Databricks از جمله Lakehouse Architecture آشنایی با دانش SQL Cloud Computing (اعم از Azure، GCP یا AWS) دسترسی به حساب پلتفرم ابری (اعم از Azure، GCP یا AWS) آگاهی از کنترل نسخه (اختیاری)
آیا آماده باز کردن پتانسیل کامل خطوط لوله تجزیه و تحلیل داده خود هستید؟ dbt on Databricks یک دوره آموزشی جامع است که برای متخصصان داده طراحی شده است که با هدف تسلط بر تبدیل داده ها با استفاده از dbt (ابزار ساخت داده) در پلت فرم Databricks، از قدرت Apache Spark برای گردش کار مقیاس پذیر و کارآمد استفاده می کند.
در حالی که Databricks قابلیتهای پردازش داده قوی را ارائه میدهد، dbt تجربه را با ارائه چارچوبی برای تبدیلهای مبتنی بر نسخه کنترلشده، ماژولار و قابل آزمایش مبتنی بر SQL افزایش میدهد. این ترکیب از قدرت Apache Spark برای گردشهای کاری مقیاسپذیر استفاده میکند و در عین حال کدهای تمیزتر، قابل نگهداریتر و قابل استفاده مجدد را حفظ میکند.
این دوره هم dbt Cloud و هم dbt Core را پوشش میدهد و یادگیرندگان را با مهارتهای همهکاره برای هر محیطی مجهز میکند.
آنچه این دوره شامل می شود:
مقدمهای بر dbt و مفاهیم کلیدی: با یک مرور کلی از dbt، قالبسازی Jinja و YAML برای پیکربندی شروع کنید. درک کنید که چگونه این ابزارها برای ساده کردن تبدیل داده ها با هم ترکیب می شوند.
راهاندازی محیط: راهنمای گام به گام پیکربندی dbt Cloud با Databricks، ملزومات کنترل نسخه، و مقدمهای بر اجزای اصلی و خطوط لوله داده را دنبال کنید.
مدلسازی و تبدیل دادهها: معماری دادههای چند لایه، از جمله مدلهای برنزی، نقرهای و طلایی را کاوش کنید. روش های عملی برای ارجاع منبع، پیکربندی طرحواره و ایجاد خطوط لوله داده کارآمد با استفاده از دستورات dbt بیاموزید.
آزمایش و اعتبارسنجی پیشرفته: بررسیهای قوی کیفیت دادهها را از طریق آزمایشهای عمومی و منفرد، انتقال از تستها: syntax به data_tests: و ادغام بستههای dbt مانند dbt_utils برای عملکرد بهبودیافته، اجرا کنید.
Jinja، ماکروها و توابع سفارشی: بر هنر کدهای قابل استفاده مجدد و مقیاس پذیر با نحو و ماکروهای Jinja مسلط شوید. مهارت های دستکاری مدل های داده را به صورت پویا، تغییر طرحواره ها و توسعه منطق سفارشی برای موارد استفاده خاص به دست آورید.
مادیسازیها توضیح داده شده: استراتژیهای مختلف مادیسازی از جمله جداول، نماها، بارهای افزایشی و عکسهای فوری را درک کنید. سناریوهای خاصی مانند SCD نوع 2 برای جداول ابعاد و به روز رسانی های افزایشی برای جداول واقعی را بررسی کنید.
استقرار و گردش کار تولید: یک محیط dbt آماده برای تولید بر روی Databricks راه اندازی کنید، مشاغل را مدیریت کنید و مدل ها را به طور یکپارچه اجرا کنید. پیکربندی محیط و متغیرهای هدف را برای گردش کار CI/CD ساده شده بیاموزید.
توسعه با dbt Core : انعطاف پذیری dbt Core را از طریق راه اندازی پروژه های محلی، ادغام GitHub و پیمایش خط فرمان، و در عین حال یادگیری بهترین شیوه ها برای کنترل نسخه و همکاری، تجربه کنید.
عیبیابی و تکنیکهای پیشرفته: در مورد رسیدگی به مشکلات رایج اتصال، بهینهسازی عملکرد پروژه، و مقیاسبندی حجمهای کاری در Databricks، بینشی به دست آورید.
مخاطب هدف:
این دوره برای مهندسان داده، تحلیلگران و معمارانی طراحی شده است که قبلاً با SQL آشنا هستند و می خواهند مهارت های خود را در تبدیل داده ها با استفاده از dbt در پلت فرم Databricks ارتقا دهند. دانش اولیه Python، Git و محیط های داده مبتنی بر ابر توصیه می شود.
چرا این دوره را بگذرانید؟
این دوره با پروژههای عملی، تمرینهای هدایتشده، و منابع قابل دانلود، مهارتهای عملی را ایجاد میکند که میتواند در چالشهای دادههای دنیای واقعی اعمال شود. در پایان دوره، مهارت در ساخت، آزمایش، و استقرار خطوط لوله داده قوی، یادگیرندگان را به عنوان متخصصان ماهر داده متمایز خواهد کرد که برای رسیدگی به جریانهای کاری تجزیه و تحلیل پیچیده مجهز هستند.
سرفصل ها و درس ها
مقدمه
Introduction
معرفی دوره
Course Introduction
پیش نیازها
Pre-requisites
dbt چیست؟
What is dbt?
جینجا چیست؟
What is Jinja?
YAML چیست؟
What is YAML?
DAG چیست؟
What is a DAG?
dbt Cloud معرفی و تنظیم منابع
dbt Cloud Introduction and Resource Set Up
مدیریت هزینه و نیازهای منابع
Cost Management and Resource Requirements
نحوه دریافت Databricks در نسخه آزمایشی رایگان
How to get Databricks on Free Trials
مالویک بیش از 10 سال کار و مشاوره با تعدادی از شرکت های فهرست شده در لیست/لیست نشده به عنوان متخصص داده و BI را گذرانده است. در طول زندگی حرفه ای خود ، مالویک یک مهارت در تجزیه و تحلیل داده ها و تجسم ، با مهارت در مورد تعدادی از زبان های برنامه نویسی از جمله SQL ، Python و R. ایجاد کرده است. او به طور گسترده با تعدادی از سیستم عامل های نرم افزاری پیشرو از جمله Hadoop ، Oracle ، MySQL ، MS SQL Server ، Qlik و Microsoft Power Platforms. وی دارای تعدادی گواهینامه از جمله: · کارشناس راه حل های مجاز مایکروسافت: مدیریت داده و تجزیه و تحلیل · Microsoft Certified Solutions Associate: گزارشگری BI · مجوز Qlik Sense Data Architect
نمایش نظرات