آموزش مدیریت داده‌های حجیم (Big Data) در کلاسترها و فضای ذخیره‌سازی ابری - آخرین آپدیت

دانلود Managing Big Data in Clusters and Cloud Storage

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: در این دوره، شما نحوه مدیریت مجموعه‌داده‌های حجیم، روش‌های بارگذاری آن‌ها در کلاسترها و فضای ذخیره‌سازی ابری و چگونگی اعمال ساختار بر داده‌ها را می‌آموزید تا بتوانید با استفاده از موتورهای SQL توزیع‌شده مانند Apache Hive و Apache Impala روی آن‌ها کوئری اجرا کنید. همچنین خواهید آموخت که بر اساس ابزارهای مورد استفاده و سطح عملکرد مورد نیاز، چگونه انواع داده‌ها، سیستم‌های ذخیره‌سازی و فرمت‌های فایل مناسب را انتخاب کنید. در پایان این دوره، شما قادر خواهید بود: • از ابزارهای مختلف برای مرور پایگاه‌های داده و جداول موجود در سیستم‌های بیگ دیتا استفاده کنید؛ • از ابزارهای متنوع برای بررسی فایل‌ها در سیستم‌های فایل توزیع‌شده بیگ دیتا و فضای ابری بهره ببرید؛ • پایگاه‌های داده و جداول بیگ دیتا را با استفاده از Apache Hive و Apache Impala ایجاد و مدیریت کنید؛ • انواع مختلف داده‌ها و فرمت‌های فایل را برای سیستم‌های داده‌های حجیم توصیف کرده و انتخاب کنید. برای استفاده از محیط عملی این دوره، نیاز به دانلود و نصب یک ماشین مجازی و نرم‌افزارهای مربوطه دارید. پیش از شروع، مطمئن شوید که به کامپیوتری با مشخصات سخت‌افزاری و نرم‌افزاری زیر دسترسی دارید: • سیستم‌عامل ویندوز، macOS یا لینوکس (تبلت‌های اندرویدی و آیپد پشتیبانی نمی‌شوند) • سیستم‌عامل 64 بیتی (سیستم‌های 32 بیتی پشتیبانی نمی‌شوند) • حافظه رم 8 گیگابایت یا بیشتر • فضای خالی دیسک 25 گیگابایت یا بیشتر • فعال بودن قابلیت مجازی‌سازی Intel VT-x یا AMD-V (در مک‌های اینتل همیشه فعال است؛ در ویندوز و لینوکس ممکن است نیاز به فعال‌سازی در BIOS باشد) • فقط برای ویندوز XP: نصب یک نرم‌افزار استخراج فایل مانند 7-Zip یا WinZip الزامی است.

سرفصل ها و درس ها

آشنایی با داده‌ها در کلاسترها و فضای ذخیره‌سازی ابری Orientation to Data in Clusters and Cloud Storage

  • خوش‌آمدگویی به دوره Welcome to the Course

  • مرور جداول با استفاده از Hue Browsing Tables with Hue

  • مرور جداول با دستورات ابزار SQL Browsing Tables with SQL Utility Statements

  • مرور HDFS با مرورگر فایل Hue Browsing HDFS with the Hue File Browser

  • مرور HDFS از طریق خط فرمان (Command Line) Browsing HDFS from the Command Line

  • درک S3 و سایر پلتفرم‌های ذخیره‌سازی ابری Understanding S3 and Other Cloud Storage Platforms

  • مرور باکت‌های S3 از طریق خط فرمان Browsing S3 Buckets from the Command Line

تعریف پایگاه‌های داده، جداول و ستون‌ها Defining Databases, Tables, and Columns

  • مقدمه هفته دوم Week 2 Introduction

  • آشنایی با دستور CREATE TABLE Introduction to the CREATE TABLE Statement

  • استفاده از طرح‌های (Schemas) مختلف روی داده‌های یکسان Using Different Schemas on the Same Data

  • تعیین ویژگی‌های جدول (TBLPROPERTIES) Specifying TBLPROPERTIES

  • بررسی، اصلاح و حذف جداول Examining, Modifying, and Removing Tables

  • تعامل‌پذیری بین Hive و Impala Hive and Impala Interoperability

  • به‌روزرسانی متادیتای Impala Impala Metadata Refresh

انواع داده‌ها و انواع فایل‌ها Data Types and File Types

  • مقدمه هفته سوم Week 3 Introduction

  • مروری بر انواع داده‌ها Overview of Data Types

  • انتخاب نوع داده مناسب Choosing the Right Data Types

  • مروری بر انواع فایل‌ها Overview of File Types

  • انتخاب نوع فایل مناسب Choosing the Right File Types

مدیریت مجموعه‌داده‌ها در کلاسترها و فضای ابری Managing Datasets in Clusters and Cloud Storage

  • مقدمه هفته چهارم Week 4 Introduction

  • به‌روزرسانی حافظه موقت متادیتای Impala پس از بارگذاری داده‌ها Refresh Impala's Metadata Cache after Loading Data

  • بارگذاری فایل‌ها در HDFS با مرورگر جدول Hue Loading Files into HDFS with Hue's Table Browser

  • بارگذاری فایل‌ها در HDFS با مرورگر فایل Hue Loading Files into HDFS with Hue's File Browser

  • بارگذاری فایل‌ها در HDFS از طریق خط فرمان Loading Files into HDFS from the Command Line

  • بارگذاری فایل‌ها در S3 از طریق خط فرمان Loading Files into S3 from the Command Line

  • استفاده از Hive و Impala برای بارگذاری داده‌ها در جداول Using Hive and Impala to Load Data into Tables

  • جمع‌بندی Conclusion

بهینه‌سازی Hive و Impala (سطح پیشرفته) Optimizing Hive and Impala (Honors)

  • مقدمه هفته پنجم Week 5 Introduction

  • راهکارها برای کوئری‌های بیش از حد پیچیده What to Do When Queries Are Too Complex

  • راهکارها برای کوئری‌های بسیار زمان‌بر What to Do When Queries Take Too Long

  • زمان مناسب برای استفاده از پارتیشن‌بندی جداول When to Use Table Partitioning

  • زمان مناسب برای استفاده از ستون‌های پیچیده When to Use Complex Columns

  • مقایسه سیستم‌های فایل در برابر موتورهای ذخیره‌سازی File Systems versus Storage Engines

نمایش نظرات

آموزش مدیریت داده‌های حجیم (Big Data) در کلاسترها و فضای ذخیره‌سازی ابری
جزییات دوره
20h 57m
33
(آخرین آپدیت)
12,757
4.9 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده

Ian Cook Ian Cook