مهندسی داده همه چیز در مورد ایجاد خطوط لوله داده است تا داده ها را از منابع متعدد به دریاچه های داده یا انبارهای داده و سپس از دریاچه های داده یا انبارهای داده به سیستم های پایین دستی منتقل کند. به عنوان بخشی از این دوره، من شما را با نحوه ساخت خطوط لوله مهندسی داده با استفاده از Azure Data Analytics Stack آشنا خواهم کرد. این شامل خدماتی مانند Azure Storage (هر دو Blob و ADLS)، ADF Data Flow، ADF Pipeline، Azure SQL، Azure Synapse، Azure Databricks و بسیاری دیگر است.
به عنوان بخشی از این دوره، ابتدا محیطی را برای یادگیری استفاده از VS Code در ویندوز و مک تنظیم خواهید کرد.
هنگامی که محیط آماده شد، باید برای Azure Portal ثبت نام کنید. ما همه دستورالعملها را برای ثبتنام در حساب پورتال Azure ارائه میکنیم، از جمله بررسی صورتحساب و همچنین دریافت اعتبار ۲۰۰ دلاری که حداکثر تا یک ماه اعتبار دارد.
ما معمولاً از Azure Storage به عنوان Data Lake استفاده می کنیم. به عنوان بخشی از این دوره، نحوه استفاده از Azure Storage به عنوان Data Lake و نحوه مدیریت فایل ها در Azure Storage با استفاده از ابزارهایی مانند Azure Storage Explorer را خواهید آموخت.
ADF هم برای ETL و هم برای ارکستراسیون استفاده می شود. ابتدا، نحوه اجرای ETL را با استفاده از ADF Data Flow خواهید فهمید. منبع و هدف فایلهای موجود در حساب ذخیرهسازی Azure خواهد بود. به عنوان بخشی از این فرآیند، همچنین نحوه راهاندازی سرویسهای پیوندی و مجموعه دادهها را در ADF خواهید آموخت.
هنگامی که ADF Data Flow آماده شد، با استفاده از ADF Pipeline، Pipeline for Orchestration را می سازید. همچنین نحوه پارامترسازی و همچنین نحوه مراقبت از بار پایه را خواهید آموخت.
همچنین تکنیکهای تنظیم عملکرد کلیدی را با استفاده از خط لوله ADF مانند کنترل تعداد پارتیشنها، زمانهای اجرا یکپارچه سفارشی (IR) و غیره درک خواهید کرد.
Azure RDBMS را بهعنوان سرویسهای مختلف برای Postgres، SQL Server و غیره ارائه میکند. شما یاد خواهید گرفت که چگونه Azure SQL را راهاندازی کنید، پس از راهاندازی Azure SQL، همچنین نحوه ایجاد جداول مورد نیاز و اجرای پرسوجوها را در برابر آنها خواهید آموخت.
ADF کپی داده ADF را برای کپی کردن داده ها از منابع مختلف و اهداف مختلف فراهم می کند. پس از آماده شدن جداول پایگاه داده، از ADF Data Copy برای کپی کردن داده ها در جداول استفاده خواهید کرد.
Azure تجزیه و تحلیل Synapse را برای Data Warehouse ارائه می دهد. شما یک نمای کلی از هر دو استخر بدون سرور و همچنین اختصاصی دریافت خواهید کرد. در نهایت با استفاده از ADF، استخر اختصاصی را برای ETL راه اندازی خواهید کرد.
هنگامی که Azure SQL و Azure Synapse آماده شدند، ETL Pipeline را با استفاده از ADF Data Flow و Orchestrate با استفاده از ADF Pipeline میسازید.
Azure Databricks سرویسی برای پردازش داده های بزرگ با استفاده از Spark Engine است. نحوه راه اندازی Azure Databricks، ادغام با ADLS و همچنین مدیریت اسرار را خواهید آموخت.
همچنین یک نمای کلی از Spark SQL و Pyspark Data Frame API با استفاده از Azure Databricks دریافت خواهید کرد.
شما همچنین خط لوله ELT را با استفاده از Databricks Jobs و Workflow میسازید که در آن وظایف بر اساس Pyspark و همچنین Spark SQL تعریف میشوند.
همچنین خواهید فهمید که چگونه خطوط لوله ADF را برای هماهنگ کردن نوت بوک های Databricks بسازید.
مشاور فناوری و Evangelist 13 سال تجربه در اجرای پروژه های پیچیده با استفاده از مجموعه گسترده ای از فناوری ها از جمله Big Data و Cloud. Iversity، llc - یک شرکت مستقر در ایالات متحده برای ارائه آموزش با کیفیت برای متخصصان فناوری اطلاعات و کارکنان و همچنین راه حل های مشاوره ای برای مشتریان سازمانی ، پیدا کردم. من هزاران نفر از متخصصان فناوری اطلاعات را در زمینه فن آوری های زیادی از جمله Big Data و Cloud آموزش داده ام. ایجاد حرفه ای فناوری اطلاعات برای افراد و ارائه خدمات با کیفیت به مشتریان از اهمیت بالاتری در سازمان ما برخوردار است. به عنوان یک استراتژی ورود ، ارائه آموزش با کیفیت در زمینه های ABCD خواهد بود * توسعه برنامه * داده های بزرگ و هوش تجاری * ابر * پایگاه داده ، پایگاه داده
نمایش نظرات