آموزش شروع با Spark 2

Getting Started with Spark 2

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: نسخه های 2.x Spark نمایانگر ویژگی های کاملاً متفاوت و به روز شده ای هستند. این دوره از نظر تئوری و عملی به تمام این تغییرات متمرکز خواهد شد. Spark احتمالاً محبوب ترین موتور این روزها برای پردازش داده های بزرگ است و نسخه 2.x دارای چندین ویژگی جدید است که Spark را قدرتمندتر و کار با آن آسان تر می کند. در این دوره ، شروع به کار با Spark 2 ، شما با Spark 2 بلند می شوید و می توانید شباهت ها و تفاوت های نسخه 2.x و نسخه های قدیمی را درک کنید. ابتدا می توانید معماری اساسی Spark و جزئیات Project Tungsten را مشاهده کنید که باعث بهبود عملکرد Spark 2 شده است. شما با استفاده از DataFrames از API های توسعه دهنده جدید استفاده خواهید کرد و نحوه همکاری آنها با RDD ها را از Spark 1.x مشاهده خواهید کرد. . در مرحله بعدی ، شما به پردازش داده های بزرگ خواهید پرداخت که در آن مجموعه های داده را بارگیری و تمیز می کنید ، ردیف های نامعتبر را حذف می کنید ، برای استخراج اطلاعات و انجام گروه بندی ، مرتب سازی و تجمیع با استفاده از API های جدید DataFrame ، ردیف های نامعتبر را حذف می کنید. همچنین نحوه و مکان استفاده از متغیرهای پخش شده و جمع کننده ها را مطالعه خواهید کرد. سرانجام ، شما با Spark SQL کار خواهید کرد که به شما امکان می دهد از دستورات SQL برای پردازش داده های بزرگ استفاده کنید. این دوره همچنین شامل پشتیبانی پیشرفته SQL به صورت عملیات پنجره سازی است. در پایان این دوره ، شما باید با کار با Spark DataFrames و Spark SQL بسیار راحت باشید. شما بر اساس معاملات عملکردی نسخه های قدیمی Spark در مقابل Spark 2. برای انتخاب فنی بهتر مجهز خواهید بود. نرم افزار مورد نیاز: Apache Spark 2.2، Python 2.7.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

درک تفاوت های Spark 2.x و Spark 1.x Understanding Differences Between Spark 2.x and Spark 1.x

  • بررسی اجمالی ماژول Module Overview

  • پیش نیاز و طرح کلی دوره Prerequisite and Course Outline

  • معرفی Spark Introducing Spark

  • RDDs: بلوک های اساسی ساختمان جرقه RDDs: Basic Building Blocks of Spark

  • RDDs ، مجموعه داده ها ، DataFrames: تفاوت چیست؟ RDDs, Datasets, DataFrames: What's the Difference?

  • نسخه ی نمایشی: نصب Spark 2 Demo: Installing Spark 2

  • بررسی اجمالی معماری: جرقه 1 و 2 Architecture Overview: Spark 1 and 2

  • نسخه ی نمایشی: کار با RDD در Spark 2 Demo: Working with RDDs In Spark 2

  • نسخه ی نمایشی: تبدیل RDD به DataFrames Demo: Converting RDDs to DataFrames

  • نسخه ی نمایشی: کار با انواع داده های پیچیده در DataFrames Demo: Working with Complex Data Types in DataFrames

  • نسخه ی نمایشی: معرفی متن SQL Demo: Introducing the SQL Context

  • نسخه ی نمایشی: دسترسی به RDD ها در DataFrames Demo: Accessing RDDs in DataFrames

  • نسخه ی نمایشی: Spark DataFrames و Pandas DataFrames Demo: Spark DataFrames and Pandas DataFrames

  • درک تفاوت های Spark 2 و Spark 1 Understanding the Differences Between Spark 2 and Spark 1

  • پروژه تنگستن Project Tungsten

کاوش و تجزیه و تحلیل داده ها با DataFrames Exploring and Analyzing Data with DataFrames

  • بررسی اجمالی ماژول Module Overview

  • معرفی جلسه جرقه Introducing the Spark Session

  • نسخه ی نمایشی: کاوش در بانک اطلاعات جرم لندن Demo: Exploring the London Crime Dataset

  • نسخه ی نمایشی: گروه بندی ، تجمیع و ترتیب داده ها Demo: Grouping, Aggregating, and Ordering Data

  • نسخه ی نمایشی: تجمیع و تجسم Demo: Aggregations and Visualizations

  • متغیرها و جمع کننده های پخش Broadcast Variables and Accumulators

  • نسخه ی نمایشی: UDF برای استخراج اطلاعات مربوط به بازیکنان فوتبال Demo: UDFs to Extract Information About Soccer Players

  • نسخه ی نمایشی: کار با Joins در DataFrames Demo: Working with Joins in DataFrames

  • نسخه ی نمایشی: با استفاده از متغیرهای پخش Demo: Using Broadcast Variables

  • نسخه ی نمایشی: کار با باتری ها Demo: Working with Accumulators

  • نسخه ی نمایشی: ذخیره DataFrames به عنوان پرونده های CSV و JSON Demo: Saving DataFrames as CSV and JSON Files

  • نسخه ی نمایشی: استفاده از باتری های سفارشی Demo: Using Custom Accumulators

  • نسخه ی نمایشی: دیگر به عملیات بپیوندید Demo: Other Join Operations

جستجوی داده ها با استفاده از Spark SQL Querying Data Using Spark SQL

  • بررسی اجمالی ماژول Module Overview

  • Demo: Basic Spark SQL Operations Demo: Basic Spark SQL Operations

  • نسخه ی نمایشی: استفاده از Spark SQL برای تجزیه و تحلیل داده های هواپیمایی Demo: Using Spark SQL to Analyze Airline Data

  • Catalyst Optimizer The Catalyst Optimizer

  • نسخه ی نمایشی: طرح های استنباطی و صریح Demo: Inferred and Explicit Schemas

  • عملکردهای پنجره چگونه کار می کنند؟ How Do Window Functions Work?

  • نسخه ی نمایشی: توابع پنجره Demo: Window Functions

  • خلاصه و یادگیری بیشتر Summary and Further Learning

نمایش نظرات

نظری ارسال نشده است.

آموزش شروع با Spark 2
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
2h 16m
37
Pluralsight (پلورال سایت) pluralsight-small
26 اردیبهشت 1397 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
94
4.7 از 5
دارد
دارد
دارد
Janani Ravi

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.