آموزش راهنمای جامع Apache Iceberg و Snowflake: پیاده‌سازی End-to-End دیتا لیک - آخرین آپدیت

دانلود Apache Iceberg + Snowflake: End-to-End Data Lake Guide

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: آموزش جامع Apache Iceberg، Snowflake، مفاهیم Data Lake / Data Lakehouse و مهندسی داده به صورت عملی مبانی Iceberg بررسی مشکلات انبار داده‌های (Data Warehouse) فعلی ایجاد دیتا لیک با استفاده از Snowflake و Iceberg درک عمیق فرمت فایل Parquet پیش نیازها: بدون نیاز به تجربه قبلی

این دوره به طور کلی به ۸ بخش تقسیم شده است،


چرا Iceberg:

در این بخش با اهمیت Iceberg و چالش‌های مربوط به معماری‌های سنتی انبار داده آشنا می‌شوید.


راه‌اندازی محیط Iceberg:

ما یک محیط Spark را به همراه Iceberg در GitHub Codespaces آماده می‌کنیم. این محیط به عنوان یک فضای آزمایشگاهی برای اجرای دستورات Iceberg و تمرین‌های عملی شما خواهد بود.


فرمت فایل Parquet:

برای ایجاد یک پایه قوی، به بررسی عمیق فرمت فایل Parquet می‌پردازیم. درک Parquet ضروری است زیرا Iceberg بر روی Apache Parquet بنا شده و از ساختار آن برای ذخیره‌سازی و کوئری‌های بهینه استفاده می‌کند.


ویژگی‌های Iceberg:

ویژگی‌های کلیدی Iceberg مانند Hidden Partitioning، Schema Evolution و Time Travel را بررسی می‌کنیم تا متوجه شویم چگونه این ابزار محدودیت‌های رایج در دیتالیک‌های سنتی را برطرف می‌کند.


مفاهیم Iceberg:

مفاهیمی مانند Copy-on-Write (COW)، Merge-on-Read (MOR) و Snapshot Isolation را بررسی می‌کنیم تا درک دقیق‌تری از نحوه مدیریت داده‌ها و تضمین سازگاری در Iceberg به دست آوریم.


Iceberg به همراه Snowflake:

تنظیمات Iceberg را در Snowflake پیکربندی کرده و نحوه ادغام این دو را بررسی می‌کنیم تا مفاهیم بنیادی استفاده از Iceberg در اکوسیستم Snowflake را یاد بگیرید.


ایجاد دیتالیک با Snowflake Iceberg:

یک نمونه دیتالیک با استفاده از Snowflake Iceberg می‌سازیم و نحوه کوئری زدن به جداول Iceberg از طریق Spark را برای بررسی قابلیت همکاری بین پلتفرم‌ها (Interoperability) نمایش می‌دهیم.


در پایان این دوره، شما درک جامعی از فرمت جدول Iceberg، مزایا، موارد استفاده و نحوه ساخت یک دیتالیک بهینه با استفاده از Iceberg خواهید داشت.


سرفصل ها و درس ها

قبل از شروع Before we start

  • کدهای منبع دوره Course code base

چرا Iceberg Why Iceberg

  • مقدمه Introduction

  • آشنایی با OLTP Introduction - OLTP

  • مشکلات سیستم‌های OLTP Problems with OLTP

  • سیستم OLAP OLAP system

  • ذخیره‌سازی در OLAP OLAP- Storage

  • فرمت فایل در OLAP OLAP- Fileformat

  • فرمت جدول در OLAP OLAP- Tableformat

  • موتور ذخیره‌سازی و پردازش OLAP OLAP- Storage and compute engine

  • کاتالوگ در OLAP OLAP- Catalog

  • مروری بر انبار داده (Data Warehouse) Datawarehouse overview

  • مزایا و معایب انبار داده Datawarehouse advantage and disadvantage

  • معماری بسته (Closed Architecture) Closed architecture

  • دیتالیک (Data Lake) Datalake

  • دیتالیک‌هاوس (Data Lakehouse) Datalakehouse

راه‌اندازی محیط Iceberg Iceberg environment setup

  • راه‌اندازی Codespaces codespaces setup

  • عملیات پایه در Iceberg Basic iceberg operations

فرمت فایل Parquet Parquet file format

  • مقدمه Introduction

  • مقایسه فرمت‌های سطری و ستونی Row wise vs columnar formats

  • ساختار فایل Parquet Parquet file structure

  • نصب Parquet CLI Install parquet cli

  • تحلیل فایل Parquet Analyse parquet file

  • متادیتای Parquet Parquet metadata

  • معماری Iceberg Iceberg architecture

ویژگی‌های Iceberg Iceberg features

  • مقدمه Introduction

  • پارتیشن پنهان (Hidden Partition) Hidden partition

  • دموی پارتیشن پنهان - بخش اول Hidden partiton demo - P1

  • دموی پارتیشن پنهان - بخش دوم Hidden partition demo - P2

  • پارتیشن پنهان: گزینه Truncate Hidden partition: Truncate option

  • پارتیشن پنهان: Bucket Hidden partition: Bucket

  • پارتیشن پنهان: تکامل پارتیشن (Partition Evolution) Hidden partition : partition evolution

  • سفر در زمان (Time Travel) Time travel

مفاهیم Iceberg Iceberg concepts

  • جداسازی اسنپ‌شات در Iceberg Iceberg snapshot isolation

  • بررسی COW و MOR COW & MOR

  • دموی COW COW : Demo

  • دموی MOR MOR : Demo

استفاده از Iceberg در Snowflake Iceberg with snowflake

  • منابع این بخش Section resources.

  • مقدمه Introduction

  • پیکربندی Iceberg در Snowflake Configure iceberg in snowflake

  • ایجاد جدول Iceberg در Snowflake Create iceberg table in snowflake

  • عملیات درج داده (Insert) Insert operation

  • کش Snowflake در جداول Iceberg Snowflake cache with iceberg table

  • عملیات به‌روزرسانی (Update) Update operation

  • عملیات حذف (Delete) Delete operation

  • خوشه‌بندی (Cluster by) در جداول Snowflake Iceberg Cluster by with snowflake iceberg table.

ساخت دیتالیک با Snowflake Iceberg Datalake with snowflake iceberg

  • منابع این بخش Section resources

  • معماری دیتالیک Data lake architecture

  • دموی دیتالیک Data lake demo

  • قابلیت همکاری بین پلتفرم‌ها Interoperability

  • کاتالوگ‌ها Catalogs

نمایش نظرات

آموزش راهنمای جامع Apache Iceberg و Snowflake: پیاده‌سازی End-to-End دیتا لیک
جزییات دوره
3.5 hours
50
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
194
4.5 از 5
دارد
دارد
دارد
Pradeep H C
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Pradeep H C Pradeep H C

مهندس داده