آموزش شروع با Spark 2

Getting Started with Spark 2

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: نسخه های 2.x Spark نمایانگر ویژگی های کاملاً متفاوت و به روز شده ای هستند. این دوره از نظر تئوری و عملی به تمام این تغییرات متمرکز خواهد شد. Spark احتمالاً محبوب ترین موتور این روزها برای پردازش داده های بزرگ است و نسخه 2.x دارای چندین ویژگی جدید است که Spark را قدرتمندتر و کار با آن آسان تر می کند. در این دوره ، شروع به کار با Spark 2 ، شما با Spark 2 بلند می شوید و می توانید شباهت ها و تفاوت های نسخه 2.x و نسخه های قدیمی را درک کنید. ابتدا می توانید معماری اساسی Spark و جزئیات Project Tungsten را مشاهده کنید که باعث بهبود عملکرد Spark 2 شده است. شما با استفاده از DataFrames از API های توسعه دهنده جدید استفاده خواهید کرد و نحوه همکاری آنها با RDD ها را از Spark 1.x مشاهده خواهید کرد. . در مرحله بعدی ، شما به پردازش داده های بزرگ خواهید پرداخت که در آن مجموعه های داده را بارگیری و تمیز می کنید ، ردیف های نامعتبر را حذف می کنید ، برای استخراج اطلاعات و انجام گروه بندی ، مرتب سازی و تجمیع با استفاده از API های جدید DataFrame ، ردیف های نامعتبر را حذف می کنید. همچنین نحوه و مکان استفاده از متغیرهای پخش شده و جمع کننده ها را مطالعه خواهید کرد. سرانجام ، شما با Spark SQL کار خواهید کرد که به شما امکان می دهد از دستورات SQL برای پردازش داده های بزرگ استفاده کنید. این دوره همچنین شامل پشتیبانی پیشرفته SQL به صورت عملیات پنجره سازی است. در پایان این دوره ، شما باید با کار با Spark DataFrames و Spark SQL بسیار راحت باشید. شما بر اساس معاملات عملکردی نسخه های قدیمی Spark در مقابل Spark 2. برای انتخاب فنی بهتر مجهز خواهید بود. نرم افزار مورد نیاز: Apache Spark 2.2، Python 2.7.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

درک تفاوت های Spark 2.x و Spark 1.x Understanding Differences Between Spark 2.x and Spark 1.x

  • بررسی اجمالی ماژول Module Overview

  • پیش نیاز و طرح کلی دوره Prerequisite and Course Outline

  • معرفی Spark Introducing Spark

  • RDDs: بلوک های اساسی ساختمان جرقه RDDs: Basic Building Blocks of Spark

  • RDDs ، مجموعه داده ها ، DataFrames: تفاوت چیست؟ RDDs, Datasets, DataFrames: What's the Difference?

  • نسخه ی نمایشی: نصب Spark 2 Demo: Installing Spark 2

  • بررسی اجمالی معماری: جرقه 1 و 2 Architecture Overview: Spark 1 and 2

  • نسخه ی نمایشی: کار با RDD در Spark 2 Demo: Working with RDDs In Spark 2

  • نسخه ی نمایشی: تبدیل RDD به DataFrames Demo: Converting RDDs to DataFrames

  • نسخه ی نمایشی: کار با انواع داده های پیچیده در DataFrames Demo: Working with Complex Data Types in DataFrames

  • نسخه ی نمایشی: معرفی متن SQL Demo: Introducing the SQL Context

  • نسخه ی نمایشی: دسترسی به RDD ها در DataFrames Demo: Accessing RDDs in DataFrames

  • نسخه ی نمایشی: Spark DataFrames و Pandas DataFrames Demo: Spark DataFrames and Pandas DataFrames

  • درک تفاوت های Spark 2 و Spark 1 Understanding the Differences Between Spark 2 and Spark 1

  • پروژه تنگستن Project Tungsten

کاوش و تجزیه و تحلیل داده ها با DataFrames Exploring and Analyzing Data with DataFrames

  • بررسی اجمالی ماژول Module Overview

  • معرفی جلسه جرقه Introducing the Spark Session

  • نسخه ی نمایشی: کاوش در بانک اطلاعات جرم لندن Demo: Exploring the London Crime Dataset

  • نسخه ی نمایشی: گروه بندی ، تجمیع و ترتیب داده ها Demo: Grouping, Aggregating, and Ordering Data

  • نسخه ی نمایشی: تجمیع و تجسم Demo: Aggregations and Visualizations

  • متغیرها و جمع کننده های پخش Broadcast Variables and Accumulators

  • نسخه ی نمایشی: UDF برای استخراج اطلاعات مربوط به بازیکنان فوتبال Demo: UDFs to Extract Information About Soccer Players

  • نسخه ی نمایشی: کار با Joins در DataFrames Demo: Working with Joins in DataFrames

  • نسخه ی نمایشی: با استفاده از متغیرهای پخش Demo: Using Broadcast Variables

  • نسخه ی نمایشی: کار با باتری ها Demo: Working with Accumulators

  • نسخه ی نمایشی: ذخیره DataFrames به عنوان پرونده های CSV و JSON Demo: Saving DataFrames as CSV and JSON Files

  • نسخه ی نمایشی: استفاده از باتری های سفارشی Demo: Using Custom Accumulators

  • نسخه ی نمایشی: دیگر به عملیات بپیوندید Demo: Other Join Operations

جستجوی داده ها با استفاده از Spark SQL Querying Data Using Spark SQL

  • بررسی اجمالی ماژول Module Overview

  • Demo: Basic Spark SQL Operations Demo: Basic Spark SQL Operations

  • نسخه ی نمایشی: استفاده از Spark SQL برای تجزیه و تحلیل داده های هواپیمایی Demo: Using Spark SQL to Analyze Airline Data

  • Catalyst Optimizer The Catalyst Optimizer

  • نسخه ی نمایشی: طرح های استنباطی و صریح Demo: Inferred and Explicit Schemas

  • عملکردهای پنجره چگونه کار می کنند؟ How Do Window Functions Work?

  • نسخه ی نمایشی: توابع پنجره Demo: Window Functions

  • خلاصه و یادگیری بیشتر Summary and Further Learning

نمایش نظرات

آموزش شروع با Spark 2
جزییات دوره
2h 16m
37
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
94
4.7 از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.