آموزش Hive to ADVANCE Hive (استفاده در زمان واقعی): ابزار پرس و جو Hadoop

Hive to ADVANCE Hive (Real time usage) :Hadoop querying tool

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: داخل و خارج از Apache Hive - از Basic Hive تا Advance Hive (مفاهیم بلادرنگ) + استفاده از مواردی که در مصاحبه ها پرسیده می شود آموزش کامل داخل و خارج از Apache HIVE (از سطح پایه تا پیشرفته). نقطه قوت این دوره ADVANCE HIVE است که شامل آن مناطق Hive است که در واقع در پروژه های Real-time استفاده می شوند. پرس و جو و مدیریت مجموعه داده های بزرگی که در فضای ذخیره سازی توزیع شده با استفاده از Hive قرار دارند. سوالات پرسیده شده از مصاحبه ها و موارد استفاده را بیاموزید. مجموعه داده ها و پرس و جوهای Hive در برگه منابع موجود هستند. پیش نیازها: دانش اولیه سیستم فایل Hadoop (HDFS) دانش پایه SQL Rest همه چیز در این دوره (Hive + Advance Hive) پوشش داده شده است.

Apache Hive یک ابزار پردازش داده در Hadoop است. این یک ابزار پرس و جو برای HDFS است و نحو پرس و جوهای آن تقریباً شبیه به SQL قدیمی ما است. Hive یک نرم افزار منبع باز است که به برنامه نویسان اجازه می دهد مجموعه داده های بزرگ را در Hadoop تجزیه و تحلیل کنند.

مزایای این دوره:

"اگر می خواهید روی پروژه های بلادرنگ کار کنید، Basic Hive کافی نیست."

با یادگیری Advance Hive از این دوره، خود را برای کار بر روی پروژه های Big Data و Hive در زمان واقعی آماده کنید. در این دوره ثبت نام کنید و دانش پایه + ADVANCE Hive + موارد استفاده از مصاحبه را به دست آورید. این دوره در نوع خود بسیار نادر است و شامل جزئیات بسیار نازکی از Hive است که در هیچ کجای آنلاین موجود نیست.

در این دوره آموزشی با آموزش گام به گام Hive به Advance Hive (که در واقع در پروژه های بلادرنگ استفاده می شود) آشنا خواهید شد:

  • متغیرها در Hive

  • ویژگی های جدول Hive

  • فرمت‌کننده ورودی سفارشی

  • نقشه و اتصالات سطلی

  • توابع پیشرفته در Hive

  • تکنیک های فشرده سازی در Hive

  • تنظیمات پیکربندی Hive

  • کار با چند جدول در Hive

  • بارگیری داده های بدون ساختار در Hive

و بسیاری موارد دیگر......

این دوره یک بسته کامل است که حتی دستورات و مفاهیمی که به ندرت استفاده می شود در Hive را توضیح می دهد. پس از اتمام این دوره، هیچ موضوعی در Hive پیدا نخواهید کرد. این دوره با در نظر گرفتن پیاده سازی واقعی Hive در پروژه های زنده ساخته شده است.

علاوه بر این، من 1 بخش دیگر را گنجانده ام که موارد استفاده از آنها در مصاحبه ها است. معمولاً دانش‌آموزان می‌توانند به سؤالات مستقیمی که مصاحبه‌کننده‌ها پرسیده‌اند پاسخ دهند، اما در موارد استفاده گیر کرده‌اند. برای این منظور موارد استفاده متداول را با کار عملی مناسب آنها در Hive توضیح داده ام.

علاوه بر این، می توانید راهنمای نصب مرحله مرحله (pdf) را برای نصب Hadoop و Apache Hive دانلود کنید


سرفصل ها و درس ها

مقدمه (نظریه) Introduction (Theory)

  • مقدمه ای بر کندو Introduction to Hive

  • اعلامیه Announcement

  • انگیزه کندو Motivation of Hive

  • Sql در مقابل Hive Sql vs Hive

  • تریلر- Working of Hive Trailer- Working of Hive

  • معماری کندو Architecture of Hive

فرمان های اساسی Hive Hive Basic Commands

  • نصب HADOOP و HIVE HADOOP AND HIVE INSTALLATION

  • ایجاد پایگاه های داده Create databases

  • ایجاد جدول و بارگذاری داده ها در آن | قسمت 1 Table creation and loading data into it |Part 1

  • ایجاد جدول و بارگذاری داده ها در آن | قسمت 2 Table creation and loading data into it |Part 2

  • جدول داخلی در مقابل خارجی - توضیح داده شده است Internal vs External table- Explained

  • جداول ایجاد کنید Create Tables

  • درج بیانیه Insert statement

  • بیانیه چند درج (پیشرفته) Multi insert statement (Advance)

  • تغییر طرح جدول Alter Table Schema

  • مرتب سازی -- مرتب سازی بر اساس، ترتیب بر اساس، توزیع بر اساس، خوشه بندی بر اساس Sorting -- sort by, order by, distribute by, cluster by

توابع در Hive Functions in Hive

  • تاریخ و توابع ریاضی Date and Mathematical functions

  • توابع رشته String functions

  • توابع Split()، Substr()، instr(). Split(), Substr(), instr() functions

  • اظهارات مشروط Conditional statements

  • انفجار و نمای جانبی (توابع پیشرفته) Explode and Lateral view ( Advance functions)

  • تابع Rlike (پیشرفته) Rlike function (Advance)

  • Rank()، Dense_rank()، Row_number() (Advance) Rank(), Dense_rank(), Row_number() (Advance)

  • توابع ریاضی را تمرین کنید Practice Mathematical Functions

پارتیشن بندی در کندو Partitioning in Hive

  • پارتیشن بندی چیست؟ What is Partitioning?

  • پارتیشن بندی استاتیک Static partitioning

  • پارتیشن بندی پویا Dynamic partitioning

  • دستور Alter Partitioned Table و MSCK Repair (Advance) Alter Partitioned Table and MSCK Repair command (Advance)

سطل سازی در کندو Bucketing in Hive

  • Bucketing چیست؟ What is Bucketing?

  • جدول سطلی ایجاد کنید Create Bucketed Table

  • نمونه برداری جداول (پیشرفت) Tablesampling (Advance)

  • No_drop، دستور آفلاین (پیشرفته) No_drop, Offline command (Advance)

  • پارتیشن بندی Partitioning

به Hive می پیوندد Joins in Hive

  • اتصالات داخلی روی 2 میز Inner Joins on 2 Tables

  • اتصالات بیرونی روی 2 میز Outer Joins on 2 Tables

  • به 3 جدول در Hive بپیوندید Join 3 Tables in Hive

  • مدیریت حافظه و بهینه سازی اتصالات Memory Management & Optimization of Joins

  • پیوستن به نقشه (پیشرفت) Map Joins (Advance)

نماها در Hive Views in Hive

  • نماها چیست؟ What are views?

  • ایجاد نماها به روش های مختلف Creating Views in different ways

  • مزایای Views Advantages of Views

نمایه سازی (پیشرفت) Indexing (Advance)

  • ایجاد ایندکس (کامپکت و بیت مپ) Creation of Indexes (Compact and Bitmap)

  • چند شاخص روی یک جدول Multiple Indexes on same table

  • چه زمانی و چه زمانی از Indexing استفاده نکنید When and When not to use Indexing

UDF (توابع تعریف شده توسط کاربر) پیشرفته UDF's (User defined functions) Advance

  • UDF چیست؟ What is UDF

  • پیاده سازی UDF - عملی UDF Implementation - Practical

مشخصات جدول (پیشرفت) Table Properties (Advance)

  • پرش از رکوردهای هدر و پاورقی در حین بارگذاری در جدول Skipping Header and Footer records while loading in table

  • ویژگی جدول غیرقابل تغییر Immutable Table property

  • ویژگی پاکسازی + تفاوت بین Drop و Truncate Purge property + Difference between Drop and Truncate

  • ویژگی Null Format Null Format property

  • ویژگی‌های اسید/معامله Hive (Advance) ACID/Transactional features of Hive ( Advance)

  • ویژگی های جدول ORC ORC Table properties

تنظیمات و تنظیمات در Hive (پیشرفته) Configurations & Settings in Hive (Advance)

  • قسمت 1 Part 1

  • قسمت 2 Part 2

  • ادغام فایل ها در Hive Merge files in Hive

  • ویژگی موازی Parallelism Property

متغیرها در Hive (Advance) Variables in Hive (Advance)

  • اجرای کوئری های Hive از پوسته Bash Executing Hive queries from Bash shell

  • دستورات یونیکس و هدوپ را از Hive Shell اجرا کنید Run Unix & Hadoop commands from Hive Shell

  • متغیرهای Hive (hiveconf & hivevar) Variables in Hive (hiveconf & hivevar)

  • تفاوت بین hiveconf و hivevar Difference between hiveconf & hivevar

  • استفاده از متغیرها در پوسته bash Using variables in bash shell

  • جایگزینی مقدار متغیر Substituting value of a Variable

  • آزمون QUIZ

انواع مختلف فایل ها در Hadoop Different Types of Files in Hadoop

  • متن، دنباله، فایل های Avro Text, Sequence, Avro Files

  • فایل های RC، ORC، پارکت RC, ORC, Parquet Files

  • نتایج تست عملکرد فایل های مختلف Performance Test results of Various Files

  • کدام فرمت فایل را انتخاب کنید Which File Format to choose

فومتر ورودی سفارشی (پیشرفته) Custom Input Fomatter (Advance)

  • استفاده از فرمت ورودی سفارشی در Hive Using Custom Input Format in Hive

متفرقه (پیشرفت) Miscellaneous (Advance)

  • حالت های کندو Modes of Hive

  • تکنیک های فشرده سازی در Hive Compression techniques in Hive

  • فایل Hiverc (ایجاد و استفاده) Hiverc file (Creation and Uses)

  • آرشیو فایل ها در Hive Archiving files in Hive

موتور TEZ در Hive TEZ engine in Hive

  • موتور Tez چیست و مقایسه آن با MR What is Tez engine and its comparison with MR

داده های XML را در Hive بارگیری کنید Load XML data in Hive

  • نحوه بارگیری داده های XML در جداول Hive-- Part1 How to Load XML data in Hive tables-- Part1

  • نحوه بارگیری داده های XML در جداول Hive-- Part2 How to Load XML data in Hive tables-- Part2

پیاده سازی SCD در Hive (پیشرفته) Implementing SCD's in Hive (Advance)

  • ابعاد آهسته در حال تغییر چیست (SCD) What is Slowly changing Dimension (SCD)

  • SCD 1 را در Hive--part1 پیاده سازی کنید Implement SCD 1 in Hive--part1

  • SCD 1 را در Hive--part2 پیاده سازی کنید Implement SCD 1 in Hive--part2

از مواردی که در مصاحبه ها پرسیده می شود استفاده کنید Use Cases asked in Interviews

  • تعداد کلمات در Hive Word count in Hive

  • چندین جدول در یک فایل Multiple Tables on a single file

نمایش نظرات

نظری ارسال نشده است.

آموزش Hive to ADVANCE Hive (استفاده در زمان واقعی): ابزار پرس و جو Hadoop
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
7 hours
76
Udemy (یودمی) udemy-small
13 دی 1401 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
24,119
4.5 از 5
دارد
دارد
دارد
J Garg

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

J Garg J Garg

مشاور ارشد داده های بزرگ در یک MNC معتبر

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.