آموزش Apache PySpark توسط مثال

Apache PySpark by Example

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: آیا می خواهید در اسرع وقت با Apache Spark بلند شوید و بدوید؟ اگر به Python کاملاً مسلط هستید ، Spark Python API (PySpark) بلیط شما برای دستیابی به قدرت این پلت فرم داده های بزرگ بسیار محبوب است. این دوره عملی و عملی به شما کمک می کند با PySpark راحت باشید ، و توضیح می دهد که چه چیزی ارائه می دهد و چگونه می تواند کار علم داده شما را تقویت کند. برای شروع ، مربی جاناتان فرناندس با کاوش در اکوسیستم Spark ، جزئیات مزایای آن را نسبت به سایر سیستم عامل های علوم داده ، API ها و مجموعه ابزارها توضیح می دهد. در مرحله بعدی ، او به API DataFrame و نحوه پاسخ این پلتفرم به بسیاری از چالش های داده های بزرگ نگاه می کند. سرانجام ، او از مجموعه داده های توزیع شده انعطاف پذیر (RDD) ، بلوک های سازنده Spark عبور می کند.
موضوعات شامل:
  • مزایای اکوسیستم Apache Spark
  • کار با DataFrame API
  • کار با ستون ها و ردیف ها
  • استفاده از توابع Spark داخلی
  • ایجاد عملکردهای خاص خود در Spark
  • کار با مجموعه داده های توزیع شده انعطاف پذیر (RDD)

سرفصل ها و درس ها

مقدمه Introduction

  • Apache PySpark Apache PySpark

  • آنچه باید بدانید What you should know

1. آشنایی با اسپارک آپاچی 1. Introduction to Apache Spark

  • اکوسیستم Apache Spark The Apache Spark ecosystem

  • چرا جرقه؟ Why Spark?

  • منشاء جرقه و دیتابریک Spark origins and Databricks

  • اجزای جرقه Spark components

  • پارتیشن ها ، تحولات ، ارزیابی های تنبل و اقدامات Partitions, transformations, lazy evaluations, and actions

2. راه اندازی فنی 2. Technical Setup

  • محیط آزمایشگاه را تنظیم کنید Set up the lab environment

  • یک دیتابیس را بارگیری کنید Download a dataset

  • واردات Importing

3. کار با API DataFrame 3. Working with the DataFrame API

  • API DataFrame The DataFrame API

  • کار با DataFrames Working with DataFrames

  • طرحواره ها Schemas

  • کار با ستون ها Working with columns

  • کار با ردیف ها Working with rows

  • راه حل Solution

4. توابع 4. Functions

  • توابع داخلی Built-in functions

  • کار با خرما Working with dates

  • توابع تعریف شده توسط کاربر User-defined functions

  • کار با پیوستن Working with joins

  • چالش Challenge

  • چالش Challenge

  • راه حل Solution

5. مجموعه داده های توزیع شده انعطاف پذیر (RDDs) 5. Resilient Distributed Datasets (RDDs)

  • RDD RDDs

  • کار با RDD Working with RDDs

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

نظری ارسال نشده است.

آموزش Apache PySpark توسط مثال
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
1h 58m
26
Linkedin (لینکدین) lynda-small
11 بهمن 1397 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
26,675
- از 5
دارد
دارد
دارد

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jonathan Fernandes Jonathan Fernandes

مشاور متمرکز بر علوم داده ، هوش مصنوعی و داده های بزرگ جاناتان فرناندس برای یک مشاور کار می کند و در درجه اول روی علوم داده ، هوش مصنوعی و داده های بزرگ تمرکز دارد.

جاناتان از کار خود لذت می برد ، زیرا عشق او به اعداد ، کدگذاری و آمار را ترکیبی می کند. جاناتان دارای مدرک کارشناسی علوم کامپیوتر و MBA از دانشگاه وارویک است.

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.