Beginning of dialog window. Escape will cancel and close the window.
End of dialog window.
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
Hive یک انبار داده است که در بالای چارچوب محاسبات توزیع شده Hadoop اجرا می شود. این مجموعه در مجموعه داده های عظیمی کار می کند ، بنابراین این دوره برای درک ویژگی های آن مفید است ، بنابراین می توانید پرس و جوهای کارآمد ، سریع و بهینه بنویسید. انبار داده Hive از پردازش تحلیلی پشتیبانی می کند ، به طور کلی کارهای طولانی مدت را پردازش می کند که مقدار زیادی داده را خرد می کند. با درک آنچه که در پشت صحنه Hive رخ می دهد ، می توانید درخواست های Hive خود را به گونه ای تنظیم کنید که بهینه و کارآمد باشد ، بنابراین تجزیه و تحلیل داده های خود را بسیار کارآمد می کنید. در این دوره ، نوشتن س Quالات تحلیلی پیچیده با Hive ، خواهید فهمید که چگونه می توانید تصمیمات طراحی بگیرید و چگونه داده ها را در جداول Hive خود بچینید. در ابتدا ، شما به تقسیم بندی و سطل سازی می روید ، که روش هایی برای کاهش داده های پردازش یک پرس و جو هستند. هنگام تنظیم جداول ، نحوه و زمان استفاده از پارتیشن بندی ، سطل سازی یا هر دو را پوشش خواهید داد. در مرحله بعدی ، شما با عملیات join همراه با پوشش نحوه برخورد با جداول بزرگ ، و اجرای و بهینه سازی join-maps آشنا خواهید شد. سرانجام ، شما توابع پنجره سازی را یاد می گیرید ، که به شما امکان می دهد پرسشهای پیچیده را به راحتی و بدون جداول متوسط بنویسید. یک بهینه سازی مهم با مجموعه داده های بزرگ. با پایان این دوره ، درک جزئیات کمی را ایجاد می کنید که نوشتن س quالات پیچیده را آسان تر و سریع تر می کند.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
استفاده از کندو برای س Quالات تحلیلی
Using Hive for Analytical Queries
مقدمه و پیش نیازهای این دوره
Introduction and Pre-requisites for This Course
یک انبار داده برای پردازش تحلیلی
A Data Warehouse for Analytical Processing
کندو به عنوان انبار داده
Hive as a Data Warehouse
مدیریت مجموعه داده های عظیم و نوشتن پرسش های سریعتر
Managing Huge Datasets and Writing Faster Queries
معرفی مختصر: سطل زنی و پارتیشن بندی
A Brief Introduction: Bucketing and Partitioning
معرفی مختصر: به بهینه سازی ها بپیوندید
A Brief Introduction: Join Optimizations
معرفی مختصر: توابع پنجره
A Brief Introduction: Window Functions
جداول پارتیشن بندی برای پرس و جوهای سریعتر
Partitioning Tables for Faster Queries
پارتیشن بندی: معادل منطقی شاخص ها
Partitioning: The Logical Equivalent of Indexes
سازمان داده با پارتیشن
Data Organization with Partitions
کار با یک جدول پارتیشن بندی شده مدیریت شده
Working with a Managed Partitioned Table
چه زمانی از پارتیشن استفاده می کنید؟
When Would You Use Partitions?
بارگیری از پرونده ها در یک جدول پارتیشن بندی شده
Loading from Files into a Partitioned Table
تقسیم جدول خارجی
Partitioning an External Table
تقسیم کردن معاملات
Partitioning Trade-offs
مقدمه ای بر پارتیشن بندی پویا
Introduction to Dynamic Partitioning
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات
نظری ارسال نشده است.