لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش راهنمای جامع Apache Iceberg و Snowflake: پیادهسازی End-to-End دیتا لیک
- آخرین آپدیت
دانلود Apache Iceberg + Snowflake: End-to-End Data Lake Guide
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
آموزش جامع Apache Iceberg، Snowflake، مفاهیم Data Lake / Data Lakehouse و مهندسی داده به صورت عملی
مبانی Iceberg
بررسی مشکلات انبار دادههای (Data Warehouse) فعلی
ایجاد دیتا لیک با استفاده از Snowflake و Iceberg
درک عمیق فرمت فایل Parquet
پیش نیازها: بدون نیاز به تجربه قبلی
این دوره به طور کلی به ۸ بخش تقسیم شده است،
چرا Iceberg:
در این بخش با اهمیت Iceberg و چالشهای مربوط به معماریهای سنتی انبار داده آشنا میشوید.
راهاندازی محیط Iceberg:
ما یک محیط Spark را به همراه Iceberg در GitHub Codespaces آماده میکنیم. این محیط به عنوان یک فضای آزمایشگاهی برای اجرای دستورات Iceberg و تمرینهای عملی شما خواهد بود.
فرمت فایل Parquet:
برای ایجاد یک پایه قوی، به بررسی عمیق فرمت فایل Parquet میپردازیم. درک Parquet ضروری است زیرا Iceberg بر روی Apache Parquet بنا شده و از ساختار آن برای ذخیرهسازی و کوئریهای بهینه استفاده میکند.
ویژگیهای Iceberg:
ویژگیهای کلیدی Iceberg مانند Hidden Partitioning، Schema Evolution و Time Travel را بررسی میکنیم تا متوجه شویم چگونه این ابزار محدودیتهای رایج در دیتالیکهای سنتی را برطرف میکند.
مفاهیم Iceberg:
مفاهیمی مانند Copy-on-Write (COW)، Merge-on-Read (MOR) و Snapshot Isolation را بررسی میکنیم تا درک دقیقتری از نحوه مدیریت دادهها و تضمین سازگاری در Iceberg به دست آوریم.
Iceberg به همراه Snowflake:
تنظیمات Iceberg را در Snowflake پیکربندی کرده و نحوه ادغام این دو را بررسی میکنیم تا مفاهیم بنیادی استفاده از Iceberg در اکوسیستم Snowflake را یاد بگیرید.
ایجاد دیتالیک با Snowflake Iceberg:
یک نمونه دیتالیک با استفاده از Snowflake Iceberg میسازیم و نحوه کوئری زدن به جداول Iceberg از طریق Spark را برای بررسی قابلیت همکاری بین پلتفرمها (Interoperability) نمایش میدهیم.
در پایان این دوره، شما درک جامعی از فرمت جدول Iceberg، مزایا، موارد استفاده و نحوه ساخت یک دیتالیک بهینه با استفاده از Iceberg خواهید داشت.
سرفصل ها و درس ها
قبل از شروع
Before we start
کدهای منبع دوره
Course code base
چرا Iceberg
Why Iceberg
مقدمه
Introduction
آشنایی با OLTP
Introduction - OLTP
مشکلات سیستمهای OLTP
Problems with OLTP
سیستم OLAP
OLAP system
ذخیرهسازی در OLAP
OLAP- Storage
فرمت فایل در OLAP
OLAP- Fileformat
فرمت جدول در OLAP
OLAP- Tableformat
موتور ذخیرهسازی و پردازش OLAP
OLAP- Storage and compute engine
کاتالوگ در OLAP
OLAP- Catalog
مروری بر انبار داده (Data Warehouse)
Datawarehouse overview
مزایا و معایب انبار داده
Datawarehouse advantage and disadvantage
نمایش نظرات