آموزش تسلط بر مهندسی داده با Databricks | Spark ETL و Delta Lake - آخرین آپدیت

دانلود Databricks | Spark ETL & Delta Lake Data Engineering Mastery

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: آموزش جامع Databricks از Spark ETL تا Unity Catalog و خط لوله‌های Medallion برای ساخت جریان‌های کاری داده مقیاس‌پذیر و تاثیرگذار مرور کلی دوره و مسیر یادگیری بررسی دقیق راهنمای آزمون Databricks چیست و چرا برای مهندسی داده اهمیت دارد ایجاد و پیمایش در محیط Databricks بررسی عمیق رابط کاربری Databricks نحوه عملکرد Databricks به عنوان یک پلتفرم یکپارچه مدیریت فایل‌ها و Notebookها در Databricks گزینه‌های Compute و تنظیمات کلاستر در Databricks محیط Notebook در Databricks و دستورات ضروری میان‌برهای بهره‌وری برای توسعه سریع‌تر مبانی معماری Lakehouse درک لایه‌های Medallion (برنزی، نقره‌ای، طلایی) تراکنش‌های ACID و ضروریات Delta Log از DBFS تا Unity Catalog لایه‌های Unity Catalog و مبانی حاکمیت داده (Data Governance) مقایسه جداول Managed و External ایجاد کاتالوگ‌ها، شمماه، جداول و Volumeها شروع کار با ETL و Apache Spark درک مدل داده‌ای Olist مبانی ETL در لایه برنزی (Bronze) کاوش در DataFrameهای لایه برنزی جداول خارجی و دسترسی به داده‌های خام شناسایی کلیدهای تکراری در لایه برنزی تحلیل مقادیر گم‌شده در لایه برنزی بررسی‌های نهایی قبل از انتقال به لایه نقره‌ای پاک‌سازی و نرمال‌سازی جدول مشتریان (Customers) تبدیل داده‌های جدول فروشندگان (Sellers) پاک‌سازی و غنی‌سازی جدول محصولات (ترکیب تمام دروس) مدیریت زمان، کیفیت و داده‌های گم‌شده در جدول سفارشات (ترکیب تمام دروس) تبدیل داده‌های Order_Items و بررسی کیفیت (ترکیب تمام دروس) اعتبارسنجی و تبدیل داده‌های پرداخت‌ها (ترکیب تمام دروس) ساخت نسخه نقره‌ای از نظرات سفارشات (ترکیب تمام دروس) پاک‌سازی داده‌های جغرافیایی و حذف تکرارها (ترکیب تمام دروس) آماده‌سازی جداول مرجع پاک در لایه نقره‌ای تحلیل توزیع مشتریان معیارهای فروشندگان و تحلیل پارتو تحلیل دسته‌بندی محصولات بر اساس وزن، حجم و تراکم درک داستان‌های تحلیلی لایه طلایی (Gold) تحلیل یکپارچه سفارشات در لایه طلایی (ترکیب تمام دروس) طراحی Joinهای تحلیلی برای استخراج بینش‌های باکیفیت پیش نیازها: یک کامپیوتر فعال (ویندوز، مک یا لینوکس) اتصال اینترنت پایدار برای دسترسی به Databricks درک پایه از پایتون (توابع، حلقه‌ها، متغیرها — فقط موارد ضروری) درک پایه از SQL (پرس‌وجوهای ساده مانند SELECT, WHERE, JOIN کافی است) علاقه‌مندی به مهندسی داده و خط لوله‌های داده واقعی کنجکاوی درباره پلتفرم‌های ابری مدرن و جریان‌های کاری ETL در مقیاس بزرگ انگیزه برای ساخت خط لوله‌های کامل end-to-end با استفاده از Databricks و Apache Spark عدم نیاز به تجربه قبلی در Databricks، Spark یا Lakehouse فقط شما، کیبورد شما و اشتیاق‌تان برای تبدیل شدن به یک مهندس داده!

به دوره «تسلط بر مهندسی داده با Databricks | Spark ETL و Delta Lake» خوش آمدید.

آموزش Databricks از Spark ETL تا Unity Catalog و خط لوله‌های Medallion برای ساخت جریان‌های کاری داده مقیاس‌پذیر و تاثیرگذار


در دنیای داده‌محور امروز، توانایی ساخت خط لوله‌های داده مقیاس‌پذیر با استفاده از پلتفرم‌های ابری مدرن یک قدرت واقعی است و هیچ کجا این تاثیر بیشتر از تسلط بر Databricks، Apache Spark و معماری Lakehouse نیست.

در این دوره جامع، یاد می‌گیرید چگونه مجموعه‌های داده خام را با استفاده از معماری کامل Medallion (برنزی ← نقره‌ای ← طلایی) به داده‌های پاک، قابل اعتماد و آماده تحلیل تبدیل کنید و در عین حال مهارت‌های عملی مورد نیاز مهندسان داده در صنعت را کسب نمایید.

Databricks قدرت پردازشی Apache Spark را با انعطاف‌پذیری Lakehouse ترکیب می‌کند و متخصصان را قادر می‌سازد تا داده‌ها را به طور بهینه مدیریت، پاک‌سازی و تحلیل کنند. چه یک مهندس داده آینده باشید، چه دانشجو یا یک متخصص شاغل، این دوره شما را با طرز فکر، تکنیک‌ها و مهارت‌های عملی برای ساخت خط لوله‌های داده مدرن در یکی از پرتقاضاترین پلتفرم‌های جهان مجهز می‌کند.


چرا این دوره؟

ساخت خط لوله‌های داده در سازمان‌های واقعی پیچیده و دشوار است. مجموعه‌های داده خام حاوی ناهماهنگی‌ها، مقادیر گم‌شده، تکرارها و دیگر چالش‌های دنیای واقعی هستند. Databricks این مشکلات را با ترکیب قابلیت‌های پردازش توزیع شده Apache Spark با ابزارهای حاکمیت داده سازمانی مانند Unity Catalog حل می‌کند.

در این دوره، گام به گام یاد می‌گیرید چگونه داده‌ها را پاک‌سازی، تبدیل، اعتبارسنجی و تحلیل کنید و در عین حال بر ابزارهای زیر مسلط شوید:

  • ساخت خط لوله‌های داده end-to-end با استفاده از Apache Spark در Databricks

  • به‌کارگیری با اطمینان معماری Medallion (برنزی ← نقره‌ای ← طلایی)

  • استفاده از Unity Catalog برای حاکمیت داده امن و مقیاس‌پذیر

  • پاک‌سازی، تبدیل، غنی‌سازی و تحلیل مجموعه‌های داده واقعی

  • اعمال بررسی‌های کیفیت داده، نرمال‌سازی و عملیات پیشرفته Spark

  • کار بهینه با جریان‌های کاری Notebook و منابع پردازشی Databricks

  • ایجاد مجموعه‌های داده تحلیلی آماده برای داشبوردها، ابزارهای BI یا یادگیری ماشین

  • توسعه طرز فکر و مهارت‌های یک مهندس داده حرفه‌ای که با سیستم‌های داده پیچیده در سطح تولید (Production) کار می‌کند


شما یک خط لوله کامل end-to-end — از جذب داده‌های خام تا تحلیل‌های با ارزش بالا — دقیقاً مانند یک مهندس داده حرفه‌ای در محیط‌های ابری امروز خواهید ساخت.

در پایان، شما فقط Databricks را نخواهید شناخت... بلکه مانند یک مهندس داده فکر خواهید کرد.


چرا تسلط بر Databricks و Spark اهمیت دارد؟

Databricks و Apache Spark قلب مهندسی داده مدرن هستند. با تغییر رویکرد شرکت‌ها به مدل Lakehouse، متخصصانی که بر تبدیل‌های Spark، قابلیت اطمینان Delta Lake و حاکمیت Unity Catalog تسلط دارند، بسیار پرتقاضا هستند.

این دوره به شما ارائه می‌دهد:

  • پایه فنی برای کار با کلان‌داده‌ها (Big Data)

  • تجربه عملی برای ساخت خط لوله‌های مقیاس‌پذیر

  • اعتماد به نفس برای فعالیت در محیط‌های ابری واقعی

چه بخواهید به عنوان مهندس داده (Data Engineer)، مهندس تحلیل (Analytics Engineer) یا متخصص داده ابری فعالیت کنید، این مهارت‌ها آینده این صنعت را تعریف می‌کنند.


Databricks چیست و چگونه در مهندسی داده مدرن استفاده می‌شود؟

Databricks یک پلتفرم مهندسی داده مبتنی بر ابر است که Apache Spark را برای پردازش ETL با کارایی بالا یکپارچه می‌کند. این پلتفرم به مهندسان داده اجازه می‌دهد تا خط لوله‌های داده مقیاس‌پذیر بسازند، جداول Delta Lake را با تراکنش‌های ACID مدیریت کنند و معماری Medallion (برنزی ← نقره‌ای ← طلایی) را برای تبدیل داده‌های خام به داده‌های آماده تحلیل پیاده‌سازی کنند. Databricks همچنین جریان‌های کاری notebook، حاکمیت داده با Unity Catalog و ابزارهایی برای مدیریت چالش‌های داده‌های واقعی مانند ناهماهنگی‌ها و تکرارها را فراهم می‌کند و آن را به یک راهکار جامع برای جریان‌های کاری داده مدرن تبدیل می‌سازد.


چرا یادگیری Apache Spark در Databricks برای مهندسان داده ضروری است؟

یادگیری Apache Spark در Databricks ضروری است زیرا مهندسان داده را قادر می‌سازد تا با استفاده از پردازش توزیع شده، مجموعه‌های داده عظیم را به طور بهینه پردازش کنند. Spark در Databricks از تبدیل‌های موازی، پاک‌سازی پیشرفته داده‌ها و تحلیل‌های آنی (Real-time) پشتیبانی می‌کند. مهندسان داده می‌توانند خط لوله‌های برنزی، نقره‌ای و طلایی را پیاده‌سازی کرده، بررسی‌های کیفیت داده را اعمال کنند و داده‌های تحلیلی با ارزش بالا را برای داشبوردها، ابزارهای BI یا مدل‌های یادگیری ماشین آماده کنند. تسلط بر Spark در Databricks، مهارت‌های عملی و تجربه آماده برای صنعت را که برای مدیریت سیستم‌های داده پیچیده در سطح تولید در محیط‌های ابری لازم است، فراهم می‌کند.


معماری Medallion در Databricks چیست و چرا برای خط لوله‌های داده مهم است؟

معماری Medallion در Databricks داده‌ها را در لایه‌های برنزی، نقره‌ای و طلایی سازماندهی می‌کند تا اطمینان حاصل شود که داده‌های خام به تدریج برای تحلیل پاک‌سازی، اعتبارسنجی و غنی می‌شوند. لایه برنزی جذب خام را ذخیره می‌کند، لایه نقره‌ای مجموعه‌های داده استاندارد و پالایش شده را ارائه می‌دهد و لایه طلایی داده‌های تحلیلی با ارزش بالا را برای داشبوردها و گزارش‌ها فراهم می‌کند. این معماری به مهندسان داده اجازه می‌دهد خط لوله‌هایی مستحکم، مقیاس‌پذیر و قابل اعتماد بسازند، کیفیت داده‌ها را حفظ کنند و حاکمیت داده در سطح سازمانی را با استفاده از Delta Lake و Unity Catalog پیاده کنند.


چرا باید این دوره را بگذرانید؟

پاسخ ما ساده است: کیفیت آموزش

آکادمی OAK مستقر در لندن، یک شرکت آموزش آنلاین است که در زمینه‌های IT، نرم‌افزار، طراحی و توسعه به زبان‌های ترکی، انگلیسی، پرتغالی و بسیاری از زبان‌های دیگر در پلتفرم Udemy بیش از ۲۰۰۰ ساعت آموزش ویدئویی ارائه داده است.

هنگام ثبت‌نام، تخصص توسعه‌دهندگان باسابقه آکادمی OAK را احساس خواهید کرد.


کیفیت تولید ویدئو و صدا

تمام محتوای ما به صورت ویدئو و صدای باکیفیت تولید شده است تا بهترین تجربه یادگیری را برای شما فراهم کند.

شما قادر خواهید بود:

  • به وضوح ببینید

  • به وضوح بشنوید

  • بدون حواس‌پرتی در دوره پیش بروید


همچنین دریافت خواهید کرد:

  • دسترسی مادام‌العمر به دوره

  • پشتیبانی سریع و دوستانه در بخش پرسش و پاسخ (Q&A)

  • گواهی اتمام دوره Udemy آماده دانلود

ما پشتیبانی کامل ارائه می‌دهیم و به تمامی سوالات شما پاسخ می‌دهیم.


همین حالا در دوره «تسلط بر مهندسی داده با Databricks | Spark ETL و Delta Lake» غوطه‌ور شوید.

آموزش Databricks از Spark ETL تا Unity Catalog و خط لوله‌های Medallion برای ساخت جریان‌های کاری داده مقیاس‌پذیر و تاثیرگذار


سرفصل ها و درس ها

مقدمه و راه‌اندازی Introduction & Setup

  • مرور کلی دوره و مسیر یادگیری Course Overview & Learning Path

  • منابع پروژه دوره Course Project Resources

  • بررسی دقیق راهنمای آزمون Exam Guide Breakdown

  • Databricks چیست و چرا مهندسی داده؟ What is Databricks & Why Data Engineering?

  • ایجاد محیط رایگان Databricks Creating Your Free Databricks Environment

  • پیمایش در رابط کاربری Databricks Navigating the Databricks User Interface

اجزای سازنده Databricks Databricks Building Blocks

  • نحوه یکپارچگی Databricks – درس اول How Databricks Fits Together – Lesson 1

  • نحوه یکپارچگی Databricks – درس دوم How Databricks Fits Together – Lesson 2

  • مدیریت فایل‌ها و Notebookها در Databricks File and Notebook Management in Databricks

  • گزینه‌های پردازشی Databricks – درس اول Databricks Compute Options – Lesson 1

  • گزینه‌های پردازشی Databricks – درس دوم Databricks Compute Options – Lesson 2

  • تنظیمات کلاستر Databricks: راهنمای تئوری و آمادگی آزمون Databricks Cluster Settings: Theoretical Guide and Certification Preparation

  • دفترچه دیجیتال و آزمایشگاه شما در Databricks – درس اول Databricks Your Digital Notebook and Laboratory – Lesson 1

  • دفترچه دیجیتال و آزمایشگاه شما در Databricks – درس دوم Databricks Your Digital Notebook and Laboratory – Lesson 2

  • دفترچه دیجیتال و آزمایشگاه شما در Databricks – درس سوم Databricks Your Digital Notebook and Laboratory – Lesson 3

  • دستورات ضروری Notebook در Databricks Essential Notebook Commands in Databricks

  • میان‌برهای هوشمند در Databricks Smart Shortcuts in Databricks

مبانی معماری Lakehouse Lakehouse Architecture Fundamentals

  • Lakehouse چیست؟ – پلتفرم داده یکپارچه What is Lakehouse? – The Unified Data Platform

  • درک لایه‌های Medallion (برنزی، نقره‌ای، طلایی) Understanding the Medallion Layers (Bronze, Silver, Gold)

  • تراکنش‌های ACID و لاگ‌های تراکنش ACID Transactions & Transaction Logs

حاکمیت داده و Unity Catalog Data Governance & Unity Catalog

  • از DBFS تا Unity Catalog: تکامل حاکمیت داده From DBFS to Unity Catalog: The Evolution of Data Governance

  • درک لایه‌های Unity Catalog Understanding Unity Catalog Layers

  • جداول Managed در مقابل External در Unity Catalog Managed vs External Tables in Unity Catalog

  • ایجاد یک Unity Catalog Creating a Unity Catalog

  • ایجاد جداول Managed – درس اول Creating Managed Tables – Lesson 1

  • ایجاد جداول Managed – درس دوم Creating Managed Tables – Lesson 2

  • ایجاد Volumeها – درس اول Creating Volumes – Lesson 1

  • ایجاد Volumeها – درس دوم Creating Volumes – Lesson 2

شروع کار با ETL و Apache Spark Getting Started with ETL Apache Spark

  • شروع کار با ETL و Apache Spark Getting Started with ETL and Apache Spark

  • درک مدل داده‌ای Understanding the Data Model

مهندسی داده با Apache Spark – لایه برنزی Data Engineering with Apache Spark – Bronze Layer

  • اولین گام‌های ETL (استخراج) با Apache Spark – درس اول Your First ETL Steps (Extract) with Apache Spark – Lesson 1

  • اولین گام‌های ETL (استخراج) با Apache Spark – درس دوم Your First ETL Steps (Extract) with Apache Spark – Lesson 2

  • اولین گام‌های ETL (استخراج) با Apache Spark – درس سوم Your First ETL Steps (Extract) with Apache Spark – Lesson 3

  • کاوش در تمام DataFrameهای برنزی با PySpark Exploring All Bronze DataFrames with PySpark

  • جداول خارجی: استفاده از داده‌های خارجی بدون وارد کردن به Databricks External Tables: Using External Data Without Bringing It into Databricks

  • شناسایی کلیدهای تکراری در لایه برنزی Detecting Duplicate Keys in the Bronze Layer

  • تحلیل مقادیر گم‌شده در لایه برنزی Missing Value Profiling in the Bronze Layer

  • بررسی‌های نهایی قبل از انتقال به لایه نقره‌ای – درس اول Final Checks Before Moving to Silver Layer – Lesson 1

  • بررسی‌های نهایی قبل از انتقال به لایه نقره‌ای – درس دوم Final Checks Before Moving to Silver Layer – Lesson 2

مهندسی داده با Apache Spark – لایه نقره‌ای Data Engineering with Apache Spark – Silver Layer

  • پاک‌سازی و نرمال‌سازی جدول مشتریان – درس اول Cleaning and Normalizing Customers Table – Lesson 1

  • پاک‌سازی و نرمال‌سازی جدول مشتریان – درس دوم Cleaning and Normalizing Customers Table – Lesson 2

  • فروشندگان Olist: تبدیل برنزی به نقره‌ای – درس اول Olist Sellers: Transforming Bronze to Silver – Lesson 1

  • فروشندگان Olist: تبدیل برنزی به نقره‌ای – درس دوم Olist Sellers: Transforming Bronze to Silver – Lesson 2

  • پاک‌سازی و غنی‌سازی جدول محصولات – درس اول Cleaning and Enriching the Products Table – Lesson 1

  • پاک‌سازی و غنی‌سازی جدول محصولات – درس دوم Cleaning and Enriching the Products Table – Lesson 2

  • پاک‌سازی و غنی‌سازی جدول محصولات – درس سوم Cleaning and Enriching the Products Table – Lesson 3

  • پاک‌سازی و غنی‌سازی جدول محصولات – درس چهارم Cleaning and Enriching the Products Table – Lesson 4

  • پاک‌سازی و غنی‌سازی جدول محصولات – درس پنجم Cleaning and Enriching the Products Table – Lesson 5

  • مدیریت زمان، کیفیت و داده‌های گم‌شده در جدول سفارشات – درس اول Time, Quality, and Missing Data Management in Orders Table – Lesson 1

  • مدیریت زمان، کیفیت و داده‌های گم‌شده در جدول سفارشات – درس دوم Time, Quality, and Missing Data Management in Orders Table – Lesson 2

  • مدیریت زمان، کیفیت و داده‌های گم‌شده در جدول سفارشات – درس سوم Time, Quality, and Missing Data Management in Orders Table – Lesson 3

  • مدیریت زمان، کیفیت و داده‌های گم‌شده در جدول سفارشات – درس چهارم Time, Quality, and Missing Data Management in Orders Table – Lesson 4

  • مدیریت زمان، کیفیت و داده‌های گم‌شده در جدول سفارشات – درس پنجم Time, Quality, and Missing Data Management in Orders Table – Lesson 5

  • تبدیل داده‌های Order_Items و بررسی کیفیت – درس اول Order_Items Data Transformation and Quality Checks – Lesson 1

  • تبدیل داده‌های Order_Items و بررسی کیفیت – درس دوم Order_Items Data Transformation and Quality Checks – Lesson 2

  • تبدیل داده‌های Order_Items و بررسی کیفیت – درس سوم Order_Items Data Transformation and Quality Checks – Lesson 3

  • اعتبارسنجی و تبدیل داده‌های پرداخت‌ها – درس اول Payments Data Validation and Transformation – Lesson 1

  • اعتبارسنجی و تبدیل داده‌های پرداخت‌ها – درس دوم Payments Data Validation and Transformation – Lesson 2

  • اعتبارسنجی و تبدیل داده‌های پرداخت‌ها – درس سوم Payments Data Validation and Transformation – Lesson 3

  • اعتبارسنجی و تبدیل داده‌های پرداخت‌ها – درس چهارم Payments Data Validation and Transformation – Lesson 4

  • ساخت نسخه نقره‌ای از order_reviews – درس اول Building the Silver Version of order_reviews – Lesson 1

  • ساخت نسخه نقره‌ای از order_reviews – درس دوم Building the Silver Version of order_reviews – Lesson 2

  • ساخت نسخه نقره‌ای از order_reviews – درس سوم Building the Silver Version of order_reviews – Lesson 3

  • پاک‌سازی داده‌های جغرافیایی و حذف تکرارها – درس اول Geolocation Data Cleaning and Deduplication – Lesson 1

  • پاک‌سازی داده‌های جغرافیایی و حذف تکرارها – درس دوم Geolocation Data Cleaning and Deduplication – Lesson 2

  • پاک‌سازی داده‌های جغرافیایی و حذف تکرارها – درس سوم Geolocation Data Cleaning and Deduplication – Lesson 3

  • پاک‌سازی داده‌های جغرافیایی و حذف تکرارها – درس چهارم Geolocation Data Cleaning and Deduplication – Lesson 4

  • جداول مرجع پاک در لایه نقره‌ای Clean Reference Tables in the Silver Layer

مهندسی داده با Apache Spark – لایه طلایی Data Engineering with Apache Spark – Gold Layer

  • تحلیل توزیع مشتریان – درس اول Customer Distribution Analysis – Lesson 1

  • تحلیل توزیع مشتریان – درس دوم Customer Distribution Analysis – Lesson 2

  • معیارهای فروشندگان و بصری‌سازی پارتو – درس اول Seller Metrics and Pareto Visualization – Lesson 1

  • معیارهای فروشندگان و بصری‌سازی پارتو – درس دوم Seller Metrics and Pareto Visualization – Lesson 2

  • تحلیل دسته‌بندی محصولات بر اساس وزن، حجم و تراکم – درس اول Analyzing Product Categories by Weight, Volume and Density – Lesson 1

  • تحلیل دسته‌بندی محصولات بر اساس وزن، حجم و تراکم – درس دوم Analyzing Product Categories by Weight, Volume and Density – Lesson 2

  • تحلیل دسته‌بندی محصولات بر اساس وزن، حجم و تراکم – درس سوم Analyzing Product Categories by Weight, Volume and Density – Lesson 3

  • لایه طلایی – هر جدول داستانی را روایت می‌کند Gold Layer – Each Table Tells Its Own Story

  • تحلیل یکپارچه سفارشات در لایه طلایی – درس اول Unified Order Gold Analytics – Lesson 1

  • تحلیل یکپارچه سفارشات در لایه طلایی – درس دوم Unified Order Gold Analytics – Lesson 2

  • تحلیل یکپارچه سفارشات در لایه طلایی – درس سوم Unified Order Gold Analytics – Lesson 3

  • تحلیل یکپارچه سفارشات در لایه طلایی – درس چهارم Unified Order Gold Analytics – Lesson 4

  • تحلیل یکپارچه سفارشات در لایه طلایی – درس پنجم Unified Order Gold Analytics – Lesson 5

  • طراحی Joinهای تحلیلی در لایه طلایی Designing Analytical Joins in the Gold Layer

بخش تکمیلی Extra

  • جمع‌بندی: تسلط بر مهندسی داده با Databricks | Spark ETL و Delta Lake Databricks | Spark ETL & Delta Lake Data Engineering Mastery

نمایش نظرات

آموزش تسلط بر مهندسی داده با Databricks | Spark ETL و Delta Lake
جزییات دوره
13 hours
83
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
400
4.6 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

OAK Academy OAK Academy

کارآفرین

OAK Academy Team OAK Academy Team

مربی

Ali̇ CAVDAR Ali̇ CAVDAR

دانشمند داده و مدرس IT