نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
نسخه های 2.x Spark نمایانگر ویژگی های کاملاً متفاوت و به روز شده ای هستند. این دوره از نظر تئوری و عملی به تمام این تغییرات متمرکز خواهد شد. Spark احتمالاً محبوب ترین موتور این روزها برای پردازش داده های بزرگ است و نسخه 2.x دارای چندین ویژگی جدید است که Spark را قدرتمندتر و کار با آن آسان تر می کند. در این دوره ، شروع به کار با Spark 2 ، شما با Spark 2 بلند می شوید و می توانید شباهت ها و تفاوت های نسخه 2.x و نسخه های قدیمی را درک کنید. ابتدا می توانید معماری اساسی Spark و جزئیات Project Tungsten را مشاهده کنید که باعث بهبود عملکرد Spark 2 شده است. شما با استفاده از DataFrames از API های توسعه دهنده جدید استفاده خواهید کرد و نحوه همکاری آنها با RDD ها را از Spark 1.x مشاهده خواهید کرد. . در مرحله بعدی ، شما به پردازش داده های بزرگ خواهید پرداخت که در آن مجموعه های داده را بارگیری و تمیز می کنید ، ردیف های نامعتبر را حذف می کنید ، برای استخراج اطلاعات و انجام گروه بندی ، مرتب سازی و تجمیع با استفاده از API های جدید DataFrame ، ردیف های نامعتبر را حذف می کنید. همچنین نحوه و مکان استفاده از متغیرهای پخش شده و جمع کننده ها را مطالعه خواهید کرد. سرانجام ، شما با Spark SQL کار خواهید کرد که به شما امکان می دهد از دستورات SQL برای پردازش داده های بزرگ استفاده کنید. این دوره همچنین شامل پشتیبانی پیشرفته SQL به صورت عملیات پنجره سازی است. در پایان این دوره ، شما باید با کار با Spark DataFrames و Spark SQL بسیار راحت باشید. شما بر اساس معاملات عملکردی نسخه های قدیمی Spark در مقابل Spark 2. برای انتخاب فنی بهتر مجهز خواهید بود. نرم افزار مورد نیاز: Apache Spark 2.2، Python 2.7.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
درک تفاوت های Spark 2.x و Spark 1.x
Understanding Differences Between Spark 2.x and Spark 1.x
-
بررسی اجمالی ماژول
Module Overview
-
پیش نیاز و طرح کلی دوره
Prerequisite and Course Outline
-
معرفی Spark
Introducing Spark
-
RDDs: بلوک های اساسی ساختمان جرقه
RDDs: Basic Building Blocks of Spark
-
RDDs ، مجموعه داده ها ، DataFrames: تفاوت چیست؟
RDDs, Datasets, DataFrames: What's the Difference?
-
نسخه ی نمایشی: نصب Spark 2
Demo: Installing Spark 2
-
بررسی اجمالی معماری: جرقه 1 و 2
Architecture Overview: Spark 1 and 2
-
نسخه ی نمایشی: کار با RDD در Spark 2
Demo: Working with RDDs In Spark 2
-
نسخه ی نمایشی: تبدیل RDD به DataFrames
Demo: Converting RDDs to DataFrames
-
نسخه ی نمایشی: کار با انواع داده های پیچیده در DataFrames
Demo: Working with Complex Data Types in DataFrames
-
نسخه ی نمایشی: معرفی متن SQL
Demo: Introducing the SQL Context
-
نسخه ی نمایشی: دسترسی به RDD ها در DataFrames
Demo: Accessing RDDs in DataFrames
-
نسخه ی نمایشی: Spark DataFrames و Pandas DataFrames
Demo: Spark DataFrames and Pandas DataFrames
-
درک تفاوت های Spark 2 و Spark 1
Understanding the Differences Between Spark 2 and Spark 1
-
پروژه تنگستن
Project Tungsten
کاوش و تجزیه و تحلیل داده ها با DataFrames
Exploring and Analyzing Data with DataFrames
-
بررسی اجمالی ماژول
Module Overview
-
معرفی جلسه جرقه
Introducing the Spark Session
-
نسخه ی نمایشی: کاوش در بانک اطلاعات جرم لندن
Demo: Exploring the London Crime Dataset
-
نسخه ی نمایشی: گروه بندی ، تجمیع و ترتیب داده ها
Demo: Grouping, Aggregating, and Ordering Data
-
نسخه ی نمایشی: تجمیع و تجسم
Demo: Aggregations and Visualizations
-
متغیرها و جمع کننده های پخش
Broadcast Variables and Accumulators
-
نسخه ی نمایشی: UDF برای استخراج اطلاعات مربوط به بازیکنان فوتبال
Demo: UDFs to Extract Information About Soccer Players
-
نسخه ی نمایشی: کار با Joins در DataFrames
Demo: Working with Joins in DataFrames
-
نسخه ی نمایشی: با استفاده از متغیرهای پخش
Demo: Using Broadcast Variables
-
نسخه ی نمایشی: کار با باتری ها
Demo: Working with Accumulators
-
نسخه ی نمایشی: ذخیره DataFrames به عنوان پرونده های CSV و JSON
Demo: Saving DataFrames as CSV and JSON Files
-
نسخه ی نمایشی: استفاده از باتری های سفارشی
Demo: Using Custom Accumulators
-
نسخه ی نمایشی: دیگر به عملیات بپیوندید
Demo: Other Join Operations
جستجوی داده ها با استفاده از Spark SQL
Querying Data Using Spark SQL
-
بررسی اجمالی ماژول
Module Overview
-
Demo: Basic Spark SQL Operations
Demo: Basic Spark SQL Operations
-
نسخه ی نمایشی: استفاده از Spark SQL برای تجزیه و تحلیل داده های هواپیمایی
Demo: Using Spark SQL to Analyze Airline Data
-
Catalyst Optimizer
The Catalyst Optimizer
-
نسخه ی نمایشی: طرح های استنباطی و صریح
Demo: Inferred and Explicit Schemas
-
عملکردهای پنجره چگونه کار می کنند؟
How Do Window Functions Work?
-
نسخه ی نمایشی: توابع پنجره
Demo: Window Functions
-
خلاصه و یادگیری بیشتر
Summary and Further Learning
نمایش نظرات