لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش ذخیرهسازی ستونی و بهینهسازی کوئریها
- آخرین آپدیت
دانلود Columnar Storage and Query Optimization
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
هر متخصص دادهای کوئریهای SQL مینویسد، اما تعداد کمی درک میکنند که چرا برخی کوئریها در دادههای یکسان، چند ثانیه و برخی دیگر چندین دقیقه زمان میبرند. پاسخ در لایههای زیرین نهفته است: در نحوه ذخیرهسازی دادهها، نحوه خواندن این دادهها توسط موتورهای کوئری و اینکه چگونه فرمتهای ستونی مانند Parquet بازی را برای عملکرد تحلیل دادهها تغییر میدهند. این دوره این درک عمیق را به شما میدهد.
شما از مفاهیم بنیادی شروع خواهید کرد؛ اینکه کامپیوترها چگونه دادهها را ذخیره و بازخوانی میکنند، عملیات SQL چگونه به صورت داخلی به دادهها دسترسی دارند و چه چیزی ذخیرهسازی ردیف-محور را از ذخیرهسازی ستون-محور متمایز میکند. از آنجا، فرمتهای ستونی مدرن (Parquet, ORC) را بررسی کرده، با DuckDB به عنوان موتور اصلی کوئریهای تحلیلی کار میکنید و یاد میگیرید که طرحهای اجرا (Execution Plans) را بخوانید تا دقیقاً تشخیص دهید کوئریها در کجا کند میشوند. هر مفهوم از طریق دموهای عملی تقویت میشود که میتوانید آنها را روی سیستم خود پیادهسازی کنید.
در پایان این دوره، شما قادر خواهید بود:
- نحوه ذخیره دادهها توسط کامپیوتر را توضیح دهید، تفاوت بین ذخیرهسازی ردیف-محور و ستون-محور را تشخیص دهید و شناسایی کنید که چه زمانی فرمتهای ستونی مزیت عملکردی ایجاد میکنند.
- با فرمتهای فایل Parquet و ORC کار کنید، آنها را با CSV مقایسه کنید و دادههای ستونی را با استفاده از DuckDB کوئری بزنید.
- طرحهای اجرای کوئریهای SQL را با استفاده از دستور EXPLAIN بخوانید و تفسیر کنید و گلوگاههای عملکردی در حجمهای کاری تحلیلی را عیبیابی کنید.
- تکنیکهای بهینهسازی کوئری در دنیای واقعی، از جمله Column Pruning، Filter Pushdown، پارتیشنبندی، Data Skipping و مقایسه عملکرد قبل و بعد از بهینهسازی را به کار بگیرید.
این دوره برای مخاطبان متنوعی طراحی شده است: تحلیلگران دادهای که میخواهند بدانند چرا کوئریهایشان کند است، مهندسان داده تازهکار که به دنبال کسب دانش بنیادی ذخیرهسازی هستند، متخصصان BI که به سمت مهندسی عملکرد یا نقشهای پلتفرم حرکت میکنند و توسعهدهندگان SQL که میخواهند فراتر از نوشتن کوئری، نحوه اجرای داخلی آنها را درک کنند.
آشنایی ابتدایی با کامپیوتر مفید است. هیچ تجربه قبلی در SQL مورد نیاز نیست، اگرچه آشنایی با دستورات پایه به شما کمک میکند سریعتر پیش بروید.
حدس زدن درباره علت کندی کوئریها را متوقف کنید. درک ذخیرهسازی، اجرا و بهینهسازی را آغاز کنید و مهارتهای بنیادی را که هر تیم داده مدرن به آن نیاز دارد، بسازید.
سرفصل ها و درس ها
مبانی ذخیرهسازی دادهها و SQL برای تحلیل دادهها
Foundations of Data Storage and SQL for Analytics
معرفی دوره
Course Introduction
بررسی کلی دادههای هسته و ساختار جدولی
Core Data and Tabular Structure Overview
مبانی ذخیرهسازی و سازماندهی دادهها
Foundations of Data Storage and Organization
کار عملی: مشاهده دادههای CSV با استفاده از ابزارهای صفحهگسترده
Hands-On: Viewing CSV Data Using Spreadsheet Tools
بررسی هدف و کاربردهای SQL
Exploring the Purpose and use of SQL
مکانیزمهای داخلی بازیابی دادههای SQL
Internal Mechanisms of SQL Data Retrieval
نمایش نظرات