آموزش Apache PySpark توسط مثال

Apache PySpark by Example

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: آیا می خواهید در اسرع وقت با Apache Spark بلند شوید و بدوید؟ اگر به Python کاملاً مسلط هستید ، Spark Python API (PySpark) بلیط شما برای دستیابی به قدرت این پلت فرم داده های بزرگ بسیار محبوب است. این دوره عملی و عملی به شما کمک می کند با PySpark راحت باشید ، و توضیح می دهد که چه چیزی ارائه می دهد و چگونه می تواند کار علم داده شما را تقویت کند. برای شروع ، مربی جاناتان فرناندس با کاوش در اکوسیستم Spark ، جزئیات مزایای آن را نسبت به سایر سیستم عامل های علوم داده ، API ها و مجموعه ابزارها توضیح می دهد. در مرحله بعدی ، او به API DataFrame و نحوه پاسخ این پلتفرم به بسیاری از چالش های داده های بزرگ نگاه می کند. سرانجام ، او از مجموعه داده های توزیع شده انعطاف پذیر (RDD) ، بلوک های سازنده Spark عبور می کند.
موضوعات شامل:
  • مزایای اکوسیستم Apache Spark
  • کار با DataFrame API
  • کار با ستون ها و ردیف ها
  • استفاده از توابع Spark داخلی
  • ایجاد عملکردهای خاص خود در Spark
  • کار با مجموعه داده های توزیع شده انعطاف پذیر (RDD)

سرفصل ها و درس ها

مقدمه Introduction

  • Apache PySpark Apache PySpark

  • آنچه باید بدانید What you should know

1. آشنایی با اسپارک آپاچی 1. Introduction to Apache Spark

  • اکوسیستم Apache Spark The Apache Spark ecosystem

  • چرا جرقه؟ Why Spark?

  • منشاء جرقه و دیتابریک Spark origins and Databricks

  • اجزای جرقه Spark components

  • پارتیشن ها ، تحولات ، ارزیابی های تنبل و اقدامات Partitions, transformations, lazy evaluations, and actions

2. راه اندازی فنی 2. Technical Setup

  • محیط آزمایشگاه را تنظیم کنید Set up the lab environment

  • یک دیتابیس را بارگیری کنید Download a dataset

  • واردات Importing

3. کار با API DataFrame 3. Working with the DataFrame API

  • API DataFrame The DataFrame API

  • کار با DataFrames Working with DataFrames

  • طرحواره ها Schemas

  • کار با ستون ها Working with columns

  • کار با ردیف ها Working with rows

  • راه حل Solution

4. توابع 4. Functions

  • توابع داخلی Built-in functions

  • کار با خرما Working with dates

  • توابع تعریف شده توسط کاربر User-defined functions

  • کار با پیوستن Working with joins

  • چالش Challenge

  • چالش Challenge

  • راه حل Solution

5. مجموعه داده های توزیع شده انعطاف پذیر (RDDs) 5. Resilient Distributed Datasets (RDDs)

  • RDD RDDs

  • کار با RDD Working with RDDs

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش Apache PySpark توسط مثال
جزییات دوره
1h 58m
26
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
26,675
- از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jonathan Fernandes Jonathan Fernandes

مشاور متمرکز بر علوم داده ، هوش مصنوعی و داده های بزرگ جاناتان فرناندس برای یک مشاور کار می کند و در درجه اول روی علوم داده ، هوش مصنوعی و داده های بزرگ تمرکز دارد.

جاناتان از کار خود لذت می برد ، زیرا عشق او به اعداد ، کدگذاری و آمار را ترکیبی می کند. جاناتان دارای مدرک کارشناسی علوم کامپیوتر و MBA از دانشگاه وارویک است.