آموزش تبدیل داده ها با Apache Pig

Data Transformations with Apache Pig

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: Pig یک موتور منبع باز برای اجرای تبدیل داده های موازی است که در Hadoop اجرا می شود. این دوره به شما نشان می دهد که چگونه Pig می تواند به شما کمک کند تا روی داده های ناقص با یک طرح ناسازگار یا اصلاً بدون برنامه کار کنید. Pig یک نرم افزار منبع باز است که بخشی از سیستم زیست محیطی Hadoop است. خوک در کار با داده هایی که فراتر از انبارهای داده سنتی نیست عالی است. این می تواند به خوبی با داده های از دست رفته ، ناقص ، و متناقض فاقد طرحواره کنار بیاید. در این دوره ، Data Transformations with Apache Pig ، با تغییرات داده با Apache آشنا خواهید شد. اول ، شما با اصول اولیه شروع خواهید کرد که به شما نشان می دهد چگونه Pig را نصب کرده و کار با پوسته Grunt را شروع کنید. در مرحله بعدی ، خواهید فهمید که چگونه داده ها را در Pig بارگیری کرده و از طریق دستورات load و store نتایج تغییر یافته را به پرونده ها ذخیره کنید. سپس ، شما بر روی یک مجموعه داده دنیای واقعی کار خواهید کرد که در آن شما با استفاده از داده های برخورد از شهر نیویورک ، حوادث NYC را تجزیه و تحلیل می کنید. سرانجام ، شما سازه های پیشرفته ای مانند nested foreach را کشف خواهید کرد و همچنین نگاهی گذرا به دنیای MapReduce می اندازد و به شما نشان می دهد که اجرای این سازه در Pig آسان است. با پایان این دوره ، شما می توانید درک بهتری از تبدیل داده ها با Apache Pig داشته باشید.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

معرفی خوک Introducing Pig

  • آنچه برای شروع به کار نیاز دارید What You Need to Get Started

  • چرا به داده نیاز داریم؟ Why Do We Need Data?

  • کندوی پردازش تحلیلی Hive for Analytical Processing

  • چه موقع از خوک Apache استفاده می کنیم؟ When Do We Use Apache Pig?

  • خوک برای استخراج ، تبدیل و بارگذاری عملیات Pig for Extract, Transform, and Load Operations

  • معرفی خوک لاتین Introducing Pig Latin

  • خوک در Hadoop و فن آوری های دیگر Pig on Hadoop and Other Technologies

با استفاده از GRUNT Shell Using the GRUNT Shell

  • خوک را بر روی دستگاه محلی خود نصب و تنظیم کنید Install and Set up Pig on Your Local Machine

  • حالت های خوک عملکرد Pig Modes of Operation

  • دستورات اساسی و پیکربندی پیام های ورود به سیستم Basic Commands and Configuring Log Messages

  • اجرای اسکریپت های خوک در حالت دسته ای Running Pig Scripts in Batch Mode

  • پشت صحنه دستورات خوک Behind the Scenes of Pig Commands

بارگیری داده ها در روابط Loading Data into Relations

  • ساختار متن خوک و مفهوم روابط The Structure of a Pig Script and the Concept of Relations

  • بارگیری داده ها از پرونده ها و فهرست ها Loading Data from Files and Directories

  • بارگیری داده ها با طرحواره Loading Data with Schema

  • ذخیره روابط در دایرکتوری ها Storing Relations in Directories

  • حساسیت موردی در خوک Case-sensitivity in Pig

  • انواع داده های اسکالر Scalar Data Types

  • انواع داده های پیچیده: Tuple Complex Data Types: The Tuple

  • انواع داده های پیچیده: کیف Complex Data Types: The Bag

  • انواع داده های پیچیده: نقشه Complex Data Types: The Map

  • کار با مشخصات طرح جزئی Working with Partial Schema Specification

کار با تحولات اساسی داده ها Working with Basic Data Transformations

  • Foreach-generate: تجسم Foreach-generate: Visualization

  • Foreach-generate: فهرست ها و نام ستون ها Foreach-generate: Indexes and Column Names

  • Foreach-generate: انواع داده های پیچیده Foreach-generate: Complex Data Types

  • دسته های عملکردهای خوک Categories of Pig Functions

  • توابع ریاضی ، رشته ای و تاریخ-زمان Math, String, and Date-time Functions

  • عملیات فیلتر The Filter Operation

  • متمایز ، محدود ، و بر اساس سفارش Distinct, Limit, and Order By

  • عملیات تقسیم The Split Operation

کار با تحولات پیشرفته داده Working with Advanced Data Transformations

  • بارگیری داده های برخورد NYC Download NYC Collision Data

  • گروه را با عملیات تجسم کنید Visualize the Group by Operation

  • گروه توسط عملیات The Group by Operation

  • جمع آوری داده های گروه بندی شده Aggregations on Grouped Data

  • به عملیات روابط بپیوندید Join Operations on Relations

  • انواع پیوستن ها Types of Joins

  • پیوندهای Left Outer ، Self و Cross را پیاده سازی کنید Implement the Left Outer, Self, and Cross Joins

  • عملیات اتحادیه The Union Operation

  • عملیات اتحادیه Onschema The Union Onschema Operation

  • عملکرد تخت The Flatten Function

اجرای MapReduce با استفاده از خوک Executing MapReduce Using Pig

  • عملیات Nested Foreach The Nested Foreach Operation

  • تجزیه و تحلیل داده های برخورد NYC با استفاده از Nested Foreach Analyze NYC Collision Data Using the Nested Foreach

  • مروری بر مدل برنامه نویسی MapReduce An Overview of the MapReduce Programming Model

  • گردش داده از طریق یک عملیات MapReduce Dataflow Through a MapReduce Operation

  • MapReduce عملیات در خوک لاتین MapReduce Operations in Pig Latin

نمایش نظرات

نظری ارسال نشده است.

آموزش تبدیل داده ها با Apache Pig
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
3h 15m
46
Pluralsight (پلورال سایت) pluralsight-small
22 اردیبهشت 1396 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
31
4.9 از 5
دارد
دارد
دارد
Janani Ravi

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.