آموزش کارخانه داده Azure برای مهندسان داده - پروژه در مورد Covid19

Azure Data Factory For Data Engineers - Project on Covid19

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: پروژه دنیای واقعی برای مهندسان داده با استفاده از Azure Data Factory، SQL، Data Lake، Databricks، HDInsight، CI/CD [DP203] شما یاد خواهید گرفت که چگونه یک خط لوله داده در دنیای واقعی در Azure Data Factory (ADF) بسازید. شما با استفاده از Azure Data Factory (ADF)، Azure Data Lake Storage Gen2، Azure SQL Database و Azure Monitor مهارت های مهندسی داده خوبی را در Azure کسب خواهید کرد. یاد خواهید گرفت که چگونه داده ها را از منابعی مانند HTTP و Azure Blob Storage به Azure Data Lake Gen2 وارد کنید. با استفاده از Azure Data Factory (ADF) شما یاد خواهید گرفت که چگونه داده ها را با استفاده از Data Flow در Azure Data Factory (ADF) تبدیل کنید و در Azure Data Lake Storage Gen2 بارگذاری کنید. نحوه تبدیل داده ها با استفاده از Databricks Notebook Activity در Azure Data Factory (ADF) را یاد خواهید گرفت. و بارگذاری در Azure Data Lake Storage Gen2 شما یاد خواهید گرفت که چگونه داده ها را با استفاده از Azure HDInsight Activity در Azure Data Factory (ADF) تبدیل کنید و در Azure Data Lake Storage Gen2 بارگذاری کنید. نحوه بارگیری داده های تبدیل شده از Azure Data Lake Storage Gen2 به Azure را یاد خواهید گرفت. پایگاه داده SQL با استفاده از Azure Data Factory (ADF) شما به طور گسترده در مورد Triggers در Azure Data Factory (ADF) و نحوه استفاده از آنها برای برنامه ریزی خطوط لوله اطلاعات خواهید آموخت. شما یاد خواهید گرفت که چگونه خطوط لوله را با استفاده از Azure Data Factory (ADF)، Azure Monitor و Log Analytics با یک پروژه دنیای واقعی نظارت کنید. شما یاد خواهید گرفت که چگونه خطوط لوله آماده تولید بسازید و شیوه های خوب و استانداردهای نامگذاری را یاد خواهید گرفت. موضوعات مورد نیاز در Azure Data Factory را برای قبولی در آزمون Azure Data Engineer Associate Certification Exam DP203 یاد خواهید گرفت. در مورد نحوه ایجاد خطوط لوله CI/CD در Azure Devops تا انتشار خطوط لوله ADF به محیط های بالاتر (تست/تولید) پیش نیازها: درک اولیه در مورد رایانش ابری مفید خواهد بود، اما ضروری نیست. تجربه در Azure لازم نیست، من شما را از طریق تمام موارد لازم برای یادگیری این دوره و ساخت پروژه راهنمایی خواهم کرد.

به روز رسانی های اصلی دوره از زمان راه اندازی

ژانویه 2023 - به روز رسانی به بخش 3 (تنظیم محیط) برای منعکس کردن تغییر در رابط کاربری. 5 درس دوباره ضبط شد.

نوامبر 2022 - افزودن بخش‌های 15 16 با تمرکز بر یکپارچه‌سازی پیوسته تحویل (CI/CD)


خوش آمدید!

من مشتاقانه منتظر هستم تا در یادگیری یکی از ابزارهای مهندسی داده مورد تقاضا در ابر، یعنی Azure Data Factory (ADF) به شما کمک کنم! این دوره با پیاده سازی یک راه حل مهندسی داده با استفاده از Azure Data Factory (ADF) برای مشکل دنیای واقعی گزارش روند Covid-19 و پیش بینی شیوع این ویروس آموزش داده شده است.

این دوره مانند هیچ دوره دیگری در Udemy برای Azure Data Factory یا Data Engineering Technologies نیست. پس از اتمام دوره شامل تمام تکالیف، من قویاً معتقدم که در موقعیتی خواهید بود که می‌توانید یک پروژه مهندسی داده در دنیای واقعی را به تنهایی شروع کنید و همچنین بر روی Azure Data Factory (ADF) مسلط خواهید بود.

من همچنین درس‌هایی در مورد راه‌حل‌های ذخیره‌سازی مانند Azure Data Lake Storage، Azure Blob Storage، Azure SQL Database و غیره گنجانده‌ام. همچنین، درس‌هایی درباره Azure HDInsight و Azure Databricks وجود دارد. من حتی دروسی را در مورد گزارش های ساختمانی با استفاده از Power BI در مورد داده های پردازش شده توسط خطوط لوله داده Azure Data Factory گنجانده ام. من مدل های یادگیری ماشین را خارج از محدوده در نظر گرفته ام. می‌توانید از این داده‌ها برای ساخت مدل‌های خود و پیش‌بینی گسترش استفاده کنید.

این دوره یک پیشرفت منطقی از اجرای پروژه در دنیای واقعی را با مفاهیم فنی توضیح داده شده و خطوط لوله داده در کارخانه داده Azure (ADF) که در همان زمان ساخته می شود را دنبال می کند. اگرچه این دوره به طور خاص برای آموزش مهارت های لازم برای گذراندن آزمون Azure Data Engineer Associate Certification DP203 طراحی نشده است، اما می تواند به شما کمک کند تا بیشتر مهارت های لازم برای امتحان را بدست آورید.

من به همان اندازه برای وقت شما ارزش قائل هستم. بنابراین، من این دوره را طوری طراحی کردم که سریع و دقیق باشد. همچنین این دوره با زبان انگلیسی ساده و بدون اصطلاحات تخصصی تدریس شده است. من دوره را از پایه شروع می کنم و در پایان دوره شما به فناوری های مورد استفاده مسلط خواهید شد.

در حال حاضر این دوره موارد زیر را به شما آموزش می دهد

Azure Data Factory

  • ساخت یک معماری راه حل برای راه حل مهندسی داده با استفاده از فناوری های Azure Data Engineering مانند Azure Data Factory (ADF)، Azure Data Lake Gen2، Azure Blob Storage، Azure Blob Database، Azure Databricks، Azure HDInsight و Microsoft PowerBI.

  • ادغام داده‌های مشتریان HTTP، Azure Blob Storage و Azure Data Lake Gen2 با استفاده از Azure Data Factory.

  • فعالیت‌های انشعاب و زنجیره‌سازی در خطوط لوله Azure Data Factory (ADF) با استفاده از فعالیت‌های جریان کنترلی مانند Get Metadata. اگر Condition، ForEach، Delete، Validation و غیره

  • استفاده از پارامترها و متغیرها در Pipelines، Datasets و LinkedServices برای ایجاد خطوط لوله مبتنی بر ابرداده در Azure Data Factory (ADF)

  • اشکال‌زدایی خطوط لوله داده و حل مشکلات.

  • زمان‌بندی خطوط لوله با استفاده از محرک‌هایی مانند Event Trigger، Schedule Trigger و Tumbling Window Trigger در Azure Data Factory (ADF)

  • ایجاد جریان های داده نقشه برداری برای ایجاد منطق تبدیل. این دوره تمام مراحل تبدیل مانند منبع، فیلتر، انتخاب، محور، جستجو، تقسیم شرطی، ستون مشتق شده، تجمع، پیوستن و تبدیل شدن را پوشش می دهد.

  • اشکال‌زدایی جریان داده، بررسی مشکلات، رفع خرابی‌ها و غیره

  • اجرای خطوط لوله Azure Data Factory برای فراخوانی جریان های داده نقشه برداری و اجرای آنها.

  • ایجاد خطوط لوله ADF برای اجرای فعالیت های HDInsight و انجام تبدیل داده ها.

  • ایجاد خطوط لوله ADF برای اجرای فعالیت های Databricks Notebook برای انجام تبدیل.

  • ایجاد وابستگی بین خطوط لوله برای تنظیم جریان داده

  • ایجاد وابستگی بین محرک‌ها برای هماهنگ کردن جریان داده

  • نظارت بر خطوط لوله داده، ایجاد هشدار، گزارش معیارها از Azure Data Factory Monitor.

  • نظارت بر خطوط لوله کارخانه داده با استفاده از مانیتور Azure و تنظیم تنظیمات تشخیصی برای ارسال به حساب ذخیره‌سازی Azure یا فضای کاری Log Analytics.

  • ایجاد فضای کاری Log Analytics، ایجاد کتاب‌های کاری و نمودارها از تجزیه و تحلیل گزارش در خطوط لوله Azure Data Factory

  • اجرای ابزار نظارت Azure Data Factory Analytics و نحوه گسترش بیشتر این قابلیت.

راه حل های ذخیره سازی Azure

  • ایجاد حساب ذخیره‌سازی Azure، ایجاد کانتینر، آپلود داده، کنترل دسترسی (IAM)، استفاده از کاوشگر فضای ذخیره‌سازی Azure برای تعامل با حساب ذخیره‌سازی

  • ایجاد Azure Data Lake Gen2، ایجاد کانتینر، آپلود داده، کنترل دسترسی (IAM)، استفاده از Azure Storage explorer برای تعامل با حساب ذخیره سازی

  • ایجاد پایگاه داده Azure SQL، ردیف‌های قیمت‌گذاری، ایجاد کاربر سرپرست، ایجاد جداول، بارگیری داده‌ها و جستجو در پایگاه داده.

Azure HDInsight Databricks

  • ایجاد خوشه های HDInsight، تعامل با رابط کاربری، استفاده از Ambari، ایجاد جداول Hive، فراخوانی فعالیت های HDInsight از Azure Data Factory

  • ایجاد فضای کاری Azure Databricks، ایجاد خوشه های Databricks، نصب حساب های ذخیره سازی، ایجاد نوت بوک Databricks، انجام تبدیل با استفاده از نوت بوک Databricks، فراخوانی نوت بوک Databricks از Azure Data Factory.

Azure Devops (CI/CD)

  • ایجاد محیط Azure Devops و پیکربندی Azure Devops Git Repository

  • فرآیند CI/CD برای انتشار مصنوعات Azure Data Factory در محیط‌های بالاتر

  • ایجاد خطوط لوله ساخت و انتشار در Azure Devops برای انتشار کد در محیط های بالاتر (Test/Prod)

  • پیکربندی/پارامترسازی خطوط لوله CI/CD برای آزادسازی خطوط لوله ADF که به ذخیره‌سازی Azure Data Lake دسترسی دارند.



سرفصل ها و درس ها

معرفی Introduction

  • معرفی دوره Course Introduction

  • ساختار دوره Course Structure

  • دانلود اسلایدهای دوره Course Slides Download

مروری Overviews

  • بررسی اجمالی کارخانه داده Azure Azure Data Factory Overview

  • بررسی اجمالی پروژه Project Overview

  • بررسی اجمالی معماری راه حل Solution Architecture Overview

  • بررسی اجمالی راه حل های ذخیره سازی Azure Azure Storage Solutions Overview

  • لینک ها و منابع مفید Useful Links & Resources

تنظیم محیط Environment Set-up

  • تنظیم محیط - نمای کلی ماژول Environment Set-up - Module Overview

  • ایجاد حساب رایگان Azure Creating Azure Free Account

  • مروری بر پورتال لاجورد Azure Portal Overview

  • ایجاد کارخانه داده Azure Creating Azure Data Factory

  • ایجاد حساب ذخیره سازی Azure Creating Azure Storage Account

  • نصب Azure Storage Explorer Installing Azure Storage Explorer

  • ایجاد Azure Data Lake Storage Gen2 Creating Azure Data Lake Storage Gen2

  • ایجاد پایگاه داده Azure SQL Creating Azure SQL Database

  • نصب Azure Data Studio Installing Azure Data Studio

  • لینک ها و منابع مفید Useful Links & Resources

بلع داده از Azure Blob Data Ingestion from Azure Blob

  • دریافت داده از Azure Blob - مرور کلی ماژول Data Ingestion from Azure Blob - Module Overview

  • کپی نمای کلی فعالیت Copy Activity Overview

  • آماده سازی محیط Environment Preparation

  • استانداردهای نامگذاری Naming Standards

  • خدمات مرتبط و مجموعه داده Linked Services & Data Sets

  • ایجاد خط لوله ADF Creating ADF Pipeline

  • فعالیت های جریان کنترل (1) - فعالیت اعتبارسنجی Control Flow Activities (1) - Validation Activity

  • کنترل فعالیت‌های جریان (2) - دریافت فراداده، اگر شرط، فعالیت‌های وب Control Flow Activities (2) - Get Metadata, If Condition, Web Activities

  • کنترل فعالیت های جریان (3) - حذف فعالیت Control Flow Activities (3) - Delete Activity

  • مروری بر محرک های ADF ADF Triggers Overview

  • ایجاد رویداد ماشه Creating Event Trigger

  • لینک ها و منابع مفید Useful Links & Resources

انتقال داده از HTTP Data Ingestion From HTTP

  • انتقال داده از HTTP - نمای کلی ماژول Data Ingestion From HTTP - Module Overview

  • مهم - تغییرات اخیر در داده های ECDC Important - Recent Changes to ECDC Data

  • بررسی اجمالی داده های ECDC ECDC Data Overview

  • خط لوله ایجاد کنید Create Pipeline

  • سوالات متداول - لطفا بخوانید Frequently Asked Questions - Please Read

  • متغیرهای خط لوله Pipeline Variables

  • پارامترهای خط لوله و ماشه زمانبندی Pipeline Parameters & Schedule Trigger

  • کنترل فعالیت های جریان Control Flow Activities

  • اشکال احتمالی ADF در درس بعدی - لطفا بخوانید ADF potential bug in the next lesson - Please Read

  • پارامترهای سرویس مرتبط Linked Service Parameters

  • خط لوله مبتنی بر فراداده Metadata Driven Pipeline

  • لینک ها و منابع مفید Useful Links & Resources

جریان داده ها - موارد و مرگ و میر تبدیل داده ها Data Flows - Cases & Deaths Data Transformation

  • جریان داده (1) - مرور کلی ماژول Data Flows(1) - Module Overview

  • مقدمه ای بر جریان داده ها Introduction to Data Flows

  • مروری بر رابط کاربری جریان داده Data Flow UI Overview

  • بررسی اجمالی نیازمندی های تحول Transformation Requirement Overview

  • تبدیل منبع Source Transformation

  • تبدیل فیلتر Filter Transformation

  • Transformation را انتخاب کنید Select Transformation

  • تبدیل محوری Pivot Transformation

  • تغییر شکل جستجو Lookup Transformation

  • تبدیل سینک Sink Transformation

  • خط لوله ADF ایجاد کنید Create ADF Pipeline

  • لینک ها و منابع مفید Useful Links & Resources

جریان داده ها - تبدیل داده های پذیرش در بیمارستان Data Flows - Hospital Admissions Data Transformation

  • جریان داده (2) - مرور کلی ماژول Data Flows(2) - Module Overview

  • نیاز تحول Transformation Requirement

  • تبدیل منبع (تکلیف) Source Transformation (Assignment)

  • تبدیل (تخصیص) را انتخاب کنید Select Transformation (Assignment)

  • کشور جستجو (تکلیف) Lookup Country (Assignment)

  • تبدیل تقسیم شرطی Conditional Split Transformation

  • تبدیل منبع - DimDate Source Transformation - DimDate

  • تبدیل ستون مشتق شده Derived Column Transformation

  • تبدیل کل Aggregate Transformation

  • به Transformation بپیوندید Join Transformation

  • تبدیل محوری (تکلیف) Pivot Transformation (Assignment)

  • تبدیل مرتب سازی Sort Transformation

  • تبدیل سینک (تخصیص) Sink Transformation (Assignment)

  • ایجاد خط لوله ADF (تخصیص) Create ADF Pipeline (Assignment)

  • لینک ها و منابع مفید Useful Links & Resources

داده ها را برای HDInsight و Data Bricks آماده کنید Prepare Data for HDInsight & Data Bricks

  • داده ها را برای HDInsight و Data Bricks آماده کنید Prepare Data for HDInsight & Data Bricks

فعالیت HDInsight HDInsight Activity

  • فعالیت HDInsight - نمای کلی ماژول HDInsight Activity - Module Overview

  • نکته برای کاربران لایه رایگان و اشتراک دانشجویی Azure Note for Azure Free Tier & Student Subscription users

  • خوشه HDInsight را ایجاد کنید Create HDInsight Cluster

  • گشت و گذار در رابط کاربری HDInsight Tour of the HDInsight UI

  • نیاز تحول Transformation Requirement

  • بررسی اسکریپت Hive Hive Script Walkthrough

  • خط لوله ADF را با فعالیت Hive ایجاد کنید Create ADF Pipeline with Hive Activity

  • خوشه HDInsight را حذف کنید Delete HDInsight Cluster

  • لینک ها و منابع مفید Useful Links & Resources

فعالیت آجرهای داده Data Bricks Activity

  • Data Bricks Activity - نمای کلی ماژول Data Bricks Activity - Module Overview

  • پیکربندی کلاستر - فقط برای اشتراک های رایگان و دانشجویی Cluster Configuration - Only for Free and Student Subscriptions

  • سرویس Azure Databricks را ایجاد کنید Create Azure Databricks Service

  • خوشه Azure Databricks را ایجاد کنید Create Azure Databricks Cluster

  • نصب Azure Data Lake Storage Mounting Azure Data Lake Storage

  • الزامات تحول Transformation Requirements

  • ایجاد فعالیت ADF Pipeline Databricks Notebook Create ADF Pipeline Databricks Notebook Activity

  • فقط برای دانش آموزانی که از اشتراک رایگان Azure استفاده می کنند Only for students using Free Azure Subscription

  • لینک ها و منابع مفید Useful Links & Resources

کپی داده ها در Azure SQL Copy Data to Azure SQL

  • کپی داده ها در Azure SQL - نمای کلی ماژول Copy Data to Azure SQL - Module Overview

  • کپی فعالیت داده - داده های موارد و مرگ و میر Copy Data Activity - Cases & Deaths Data

  • Copy Data Activity - Hospital Admissions Data Copy Data Activity - Hospital Admissions Data

  • Copy Data Activity - Testing Data Copy Data Activity - Testing Data

  • لینک ها و منابع مفید Useful Links and Resources

آماده سازی تولید خطوط لوله Making Pipelines Production Ready

  • آماده سازی تولید خطوط لوله - نمای کلی ماژول Making Pipelines Production Ready - Module Overview

  • گزینه 1 - وابستگی خط لوله Option 1 - Pipeline Dependency

  • گزینه 2 - وابستگی ماشه Option 2 - Trigger Dependency

  • لینک ها و منابع مفید Useful Links & Resources

نظارت بر Monitoring

  • نظارت - نمای کلی ماژول Monitoring - Module Overview

  • چه چیزی را نظارت کنیم و چگونه What to Monitor & How

  • مانیتور Azure Data Factory Azure Data Factory Monitor

  • ایجاد هشدارها Creating Alerts

  • مانیتور کردن خرابی های خط لوله Monitor Pipeline Failures

  • اجرای مجدد Failed Pipelines Re-run Failed Pipelines

  • گزارش در مورد متریک Reporting on Metrics

  • آشنایی با مانیتور Azure Introduction to Azure Monitor

  • مقدمه ای بر Log Analytics Introduction to Log Analytics

  • Log Analytics قابلیت های بیشتر Log Analytics Further capabilities

  • تجزیه و تحلیل کارخانه داده Azure Azure data factory analytics

  • لینک ها و منابع مفید Useful Links & Resources

گزارشات Power BI Power BI Reports

  • گزارشات Power BI - نمای کلی ماژول Power BI Reports - Module Overview

  • آشنایی با PowerBI Desktop Introduction to PowerBI Desktop

  • در گزارش کووید-19 قدم بزنید Walk through the Covid-19 Report

  • لینک ها و منابع مفید Useful Links & Resources

ادغام مداوم/تحویل مداوم (CI/CD) Continuous Integration / Continuous Delivery (CI/CD)

  • ادغام مداوم/تحویل مستمر - نمای کلی ماژول Continuous Integration/ Continuous Delivery - Module Overview

  • مقدمه ای بر ادغام پیوسته/تحویل مستمر (CI/CD) Introduction to Continuous Integration/ Continuous Delivery (CI/CD)

  • مقدمه ای بر CI/CD برای Azure Data Factory Introduction to CI/CD for Azure Data Factory

  • نمای کلی Azure DevOps Overview of Azure DevOps

  • راه اندازی محیط DevOps Azure Azure DevOps Environment Set-up

  • راه اندازی محیط کارخانه داده Azure Azure Data Factory Environment Set-up

  • Azure Data Factory Git Configuration Azure Data Factory Git Configuration

  • توسعه کد کارخانه داده Azure با استفاده از Git Azure Data Factory Code Development using Git

  • گزینه 1 - ساخت دستی Option 1 - Manual Build

  • گزینه 1 - طراحی خط لوله آزاد Option 1 - Release Pipeline Design

  • گزینه 1 - ایجاد ARM Deployment Task Option 1 - Creating ARM Deployment Task

  • گزینه 1 - تست ARM Deployment Task Option 1 - Testing ARM Deployment Task

  • گزینه 1 - مشکلات استقرار ARM Task Option 1 - Pitfalls of ARM Deployment Task

  • گزینه 1 - وظایف پیش و پس از استقرار Option 1 - Pre and Post Deployment Tasks

  • گزینه 1 - متغیرهای خط لوله Option 1 - Pipeline Variables

  • گزینه 1 - مرحله تولید را اضافه کنید Option 1 - Add Production Stage

  • گزینه 2 - بررسی اجمالی Option 2 - Overview

  • گزینه 2 - YAML Build Pipeline Script Walkthrough Option 2 - YAML Build Pipeline Script Walkthrough

  • گزینه 2 - خط لوله ساخت YAML را ایجاد کنید Option 2 - Create YAML Build Pipeline

  • گزینه 2 - به روز رسانی خط لوله انتشار Option 2 - Update Release Pipeline

  • گزینه 2 - CI/CD End to End Testing Option 2 - CI/CD End to End Testing

  • لینک ها و منابع مفید Useful Links & Resources

سناریوی CI/CD - دسترسی به دریاچه داده CI/CD Scenario - Data Lake Access

  • دسترسی به اطلاعات اجمالی ذخیره‌سازی دریاچه Access to Data Lake Storage Overview

  • راه اندازی ذخیره سازی دریاچه داده Data Lake Storage Set-up

  • استفاده از هویت مدیریت شده - اجازه دسترسی به Data Lake Using Managed Identity - Grant access to Data Lake

  • با استفاده از هویت مدیریت شده - خط لوله کارخانه داده ایجاد کنید Using Managed Identity - Create Data Factory Pipeline

  • استفاده از هویت مدیریت شده - تغییرات خط لوله را آزاد کنید Using Managed Identity - Release Pipeline changes

  • استفاده از کلیدهای دسترسی - بررسی اجمالی گزینه های راه حل Using Access Keys - Solution Options Overview

  • استفاده از کلیدهای دسترسی - راه‌اندازی خزانه کلید Using Access Keys - Key Vault Set-up

  • با استفاده از کلیدهای دسترسی - خط لوله کارخانه داده ایجاد کنید Using Access Keys - Create Data Factory Pipeline

  • استفاده از کلیدهای دسترسی - تغییرات خط لوله را آزاد کنید Using Access Keys - Release Pipeline Changes

نتیجه Conclusion

  • تبریک و موفق باشید Congratulations & Good Luck

  • سخنرانی پاداش Bonus Lecture

نمایش نظرات

آموزش کارخانه داده Azure برای مهندسان داده - پروژه در مورد Covid19
جزییات دوره
12.5 hours
146
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
44,762
4.6 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Ramesh Retnasamy Ramesh Retnasamy

مهندس/معمار داده های ابری