نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
Pig یک موتور منبع باز برای اجرای تبدیل داده های موازی است که در Hadoop اجرا می شود. این دوره به شما نشان می دهد که چگونه Pig می تواند به شما کمک کند تا روی داده های ناقص با یک طرح ناسازگار یا اصلاً بدون برنامه کار کنید. Pig یک نرم افزار منبع باز است که بخشی از سیستم زیست محیطی Hadoop است. خوک در کار با داده هایی که فراتر از انبارهای داده سنتی نیست عالی است. این می تواند به خوبی با داده های از دست رفته ، ناقص ، و متناقض فاقد طرحواره کنار بیاید. در این دوره ، Data Transformations with Apache Pig ، با تغییرات داده با Apache آشنا خواهید شد. اول ، شما با اصول اولیه شروع خواهید کرد که به شما نشان می دهد چگونه Pig را نصب کرده و کار با پوسته Grunt را شروع کنید. در مرحله بعدی ، خواهید فهمید که چگونه داده ها را در Pig بارگیری کرده و از طریق دستورات load و store نتایج تغییر یافته را به پرونده ها ذخیره کنید. سپس ، شما بر روی یک مجموعه داده دنیای واقعی کار خواهید کرد که در آن شما با استفاده از داده های برخورد از شهر نیویورک ، حوادث NYC را تجزیه و تحلیل می کنید. سرانجام ، شما سازه های پیشرفته ای مانند nested foreach را کشف خواهید کرد و همچنین نگاهی گذرا به دنیای MapReduce می اندازد و به شما نشان می دهد که اجرای این سازه در Pig آسان است. با پایان این دوره ، شما می توانید درک بهتری از تبدیل داده ها با Apache Pig داشته باشید.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
معرفی خوک
Introducing Pig
-
آنچه برای شروع به کار نیاز دارید
What You Need to Get Started
-
چرا به داده نیاز داریم؟
Why Do We Need Data?
-
کندوی پردازش تحلیلی
Hive for Analytical Processing
-
چه موقع از خوک Apache استفاده می کنیم؟
When Do We Use Apache Pig?
-
خوک برای استخراج ، تبدیل و بارگذاری عملیات
Pig for Extract, Transform, and Load Operations
-
معرفی خوک لاتین
Introducing Pig Latin
-
خوک در Hadoop و فن آوری های دیگر
Pig on Hadoop and Other Technologies
با استفاده از GRUNT Shell
Using the GRUNT Shell
-
خوک را بر روی دستگاه محلی خود نصب و تنظیم کنید
Install and Set up Pig on Your Local Machine
-
حالت های خوک عملکرد
Pig Modes of Operation
-
دستورات اساسی و پیکربندی پیام های ورود به سیستم
Basic Commands and Configuring Log Messages
-
اجرای اسکریپت های خوک در حالت دسته ای
Running Pig Scripts in Batch Mode
-
پشت صحنه دستورات خوک
Behind the Scenes of Pig Commands
بارگیری داده ها در روابط
Loading Data into Relations
-
ساختار متن خوک و مفهوم روابط
The Structure of a Pig Script and the Concept of Relations
-
بارگیری داده ها از پرونده ها و فهرست ها
Loading Data from Files and Directories
-
بارگیری داده ها با طرحواره
Loading Data with Schema
-
ذخیره روابط در دایرکتوری ها
Storing Relations in Directories
-
حساسیت موردی در خوک
Case-sensitivity in Pig
-
انواع داده های اسکالر
Scalar Data Types
-
انواع داده های پیچیده: Tuple
Complex Data Types: The Tuple
-
انواع داده های پیچیده: کیف
Complex Data Types: The Bag
-
انواع داده های پیچیده: نقشه
Complex Data Types: The Map
-
کار با مشخصات طرح جزئی
Working with Partial Schema Specification
کار با تحولات اساسی داده ها
Working with Basic Data Transformations
-
Foreach-generate: تجسم
Foreach-generate: Visualization
-
Foreach-generate: فهرست ها و نام ستون ها
Foreach-generate: Indexes and Column Names
-
Foreach-generate: انواع داده های پیچیده
Foreach-generate: Complex Data Types
-
دسته های عملکردهای خوک
Categories of Pig Functions
-
توابع ریاضی ، رشته ای و تاریخ-زمان
Math, String, and Date-time Functions
-
عملیات فیلتر
The Filter Operation
-
متمایز ، محدود ، و بر اساس سفارش
Distinct, Limit, and Order By
-
عملیات تقسیم
The Split Operation
کار با تحولات پیشرفته داده
Working with Advanced Data Transformations
-
بارگیری داده های برخورد NYC
Download NYC Collision Data
-
گروه را با عملیات تجسم کنید
Visualize the Group by Operation
-
گروه توسط عملیات
The Group by Operation
-
جمع آوری داده های گروه بندی شده
Aggregations on Grouped Data
-
به عملیات روابط بپیوندید
Join Operations on Relations
-
انواع پیوستن ها
Types of Joins
-
پیوندهای Left Outer ، Self و Cross را پیاده سازی کنید
Implement the Left Outer, Self, and Cross Joins
-
عملیات اتحادیه
The Union Operation
-
عملیات اتحادیه Onschema
The Union Onschema Operation
-
عملکرد تخت
The Flatten Function
اجرای MapReduce با استفاده از خوک
Executing MapReduce Using Pig
-
عملیات Nested Foreach
The Nested Foreach Operation
-
تجزیه و تحلیل داده های برخورد NYC با استفاده از Nested Foreach
Analyze NYC Collision Data Using the Nested Foreach
-
مروری بر مدل برنامه نویسی MapReduce
An Overview of the MapReduce Programming Model
-
گردش داده از طریق یک عملیات MapReduce
Dataflow Through a MapReduce Operation
-
MapReduce عملیات در خوک لاتین
MapReduce Operations in Pig Latin
نمایش نظرات