به روز رسانی های اصلی دوره از زمان راه اندازی
مارس 2023 - بخشهای جدید 6 و 7 اضافه شدند. بخش 8 به روز شد. این تغییرات برای انعکاس آخرین توصیه های Databricks در مورد دسترسی به Azure Data Lake است. همچنین، این راهحل بهتری برای تکمیل پروژه دوره برای دانشآموزانی که از اشتراک دانشجویی Azure یا اشتراکهای شرکتی با دسترسی محدود به Azure Active Directory استفاده میکنند، ارائه میکند.
دسامبر 2022 - بخشهای 3، 4 5 بهروزرسانی شدند تا تغییرات اخیر رابط کاربری را در Azure Databricks منعکس کنند. همچنین شامل درس هایی در مورد عملکردهای اضافی است که اخیراً توسط Databricks به خوشه های Databricks ارائه شده است. .
خوش آمدید!
من مشتاقانه منتظر هستم تا در یادگیری یکی از ابزارهای مهندسی داده مورد تقاضا در ابر، Azure Databricks به شما کمک کنم! این دوره با پیاده سازی یک راه حل مهندسی داده با استفاده از Azure Databricks و Spark core برای یک پروژه دنیای واقعی تجزیه و تحلیل و گزارش داده های مسابقه موتور فرمول 1 آموزش داده شده است.
این مانند هیچ دوره دیگری در Udemy برای Azure Databricks نیست. پس از اتمام دوره شامل تمام تکالیف، من قویاً معتقدم که در موقعیتی خواهید بود که می توانید یک پروژه مهندسی داده در دنیای واقعی را به تنهایی شروع کنید و همچنین بر Azure Databricks مسلط باشید. من همچنین درس هایی در مورد Azure Data Lake Storage Gen2، Azure Data Factory و همچنین PowerBI گنجانده ام. تمرکز اصلی این دوره Azure Databricks و Spark core است، اما مفاهیم مرتبط و اتصال به سایر فناوری های ذکر شده را نیز پوشش می دهد. لطفاً توجه داشته باشید که این دوره جنبه های دیگر Spark مانند Spark streaming و Spark ML را پوشش نمی دهد. همچنین این دوره با استفاده از PySpark و همچنین Spark SQL تدریس شده است. Scala یا Java را پوشش نمی دهد.
این دوره یک پیشرفت منطقی از اجرای پروژه در دنیای واقعی را با مفاهیم فنی توضیح داده شده و نوتبوکهای Databricks در همان زمان دنبال میکند. اگرچه این دوره به طور خاص برای آموزش مهارت های مورد نیاز برای گذراندن آزمون Azure Data Engineer Associate Certification Exam DP203 طراحی نشده است، اما می تواند به شما کمک کند تا بیشتر مهارت های لازم برای امتحان را بدست آورید.
من به همان اندازه برای وقت شما ارزش قائل هستم. بنابراین، من این دوره را طوری طراحی کردم که سریع و دقیق باشد. همچنین این دوره با زبان انگلیسی ساده و بدون اصطلاحات تخصصی تدریس شده است. من دوره را از پایه شروع می کنم و در پایان دوره شما به فناوری های مورد استفاده مسلط خواهید شد.
در حال حاضر این دوره موارد زیر را به شما آموزش می دهد
Azure Databricks
ساخت یک معماری راه حل برای راه حل مهندسی داده با استفاده از Azure Databricks، Azure Data Lake Gen2، Azure Data Factory و Power BI
ایجاد و استفاده از سرویس Azure Databricks و معماری Databricks در Azure
کار با نوت بوک Databricks و همچنین استفاده از ابزارهای Databricks، دستورات جادویی و غیره
انتقال پارامترها بین نوت بوک و همچنین ایجاد گردش کار نوت بوک
ایجاد، پیکربندی و نظارت بر خوشههای Databricks، مجموعههای کلاستر و مشاغل
نصب Azure Storage در Databricks با استفاده از اسرار ذخیره شده در Azure Key Vault
کار با جداول Databricks، Databricks File System (DBFS) و غیره
استفاده از دریاچه دلتا برای اجرای راه حل با استفاده از معماری Lakehouse
ایجاد داشبورد برای تجسم خروجی ها
اتصال به جداول Azure Databricks از PowerBI
Spark (فقط PySpark و SQL)
معماری Spark، API منابع داده و API Dataframe
PySpark - انتقال فایلهای CSV، ساده و پیچیده JSON در دریاچه داده بهعنوان فایلها/جدول پارکت.
PySpark - تبدیلهایی مانند Filter، Join، Simple Aggregations، GroupBy، Window و غیره.
PySpark - ایجاد نمای محلی و موقت
Spark SQL - ایجاد پایگاه داده، جداول و نماها
Spark SQL - تبدیلهایی مانند Filter، Join، Simple Aggregations، GroupBy، Window و غیره.
Spark SQL - ایجاد نمای محلی و موقت
اجرای الگوهای بارگذاری کامل و بارگذاری افزایشی با استفاده از پارتیشن ها
دریاچه دلتا
ظهور معماری Data Lakehouse و نقش دریاچه دلتا.
خواندن، نوشتن، بهروزرسانی، حذف و ادغام در دریاچه دلتا با استفاده از PySpark و همچنین SQL
تاریخچه، سفر در زمان و خلاء
تبدیل فایلهای پارکت به فایلهای دلتا
اجرای الگوی بار افزایشی با استفاده از دریاچه دلتا
Azure Data Factory
ایجاد خطوط لوله برای اجرای نوت بوک Databricks
طراحی خطوط لوله قوی برای مقابله با سناریوهای غیرمنتظره مانند فایل های از دست رفته
ایجاد وابستگی بین فعالیت ها و همچنین خطوط لوله
زمانبندی خطوط لوله با استفاده از محرکهای کارخانه داده برای اجرا در فواصل زمانی منظم
برای بررسی خطاها/خروجی ها، محرک ها/خطوط لوله را زیر نظر بگیرید.
مهندس/معمار داده های ابری
نمایش نظرات