لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش Apache PySpark توسط مثال
Apache PySpark by Example
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
آیا می خواهید در اسرع وقت با Apache Spark بلند شوید و بدوید؟ اگر به Python کاملاً مسلط هستید ، Spark Python API (PySpark) بلیط شما برای دستیابی به قدرت این پلت فرم داده های بزرگ بسیار محبوب است. این دوره عملی و عملی به شما کمک می کند با PySpark راحت باشید ، و توضیح می دهد که چه چیزی ارائه می دهد و چگونه می تواند کار علم داده شما را تقویت کند. برای شروع ، مربی جاناتان فرناندس با کاوش در اکوسیستم Spark ، جزئیات مزایای آن را نسبت به سایر سیستم عامل های علوم داده ، API ها و مجموعه ابزارها توضیح می دهد. در مرحله بعدی ، او به API DataFrame و نحوه پاسخ این پلتفرم به بسیاری از چالش های داده های بزرگ نگاه می کند. سرانجام ، او از مجموعه داده های توزیع شده انعطاف پذیر (RDD) ، بلوک های سازنده Spark عبور می کند.
موضوعات شامل:
مزایای اکوسیستم Apache Spark
کار با DataFrame API
کار با ستون ها و ردیف ها li>
استفاده از توابع Spark داخلی li>
ایجاد عملکردهای خاص خود در Spark
کار با مجموعه داده های توزیع شده انعطاف پذیر (RDD)
سرفصل ها و درس ها
مقدمه
Introduction
Apache PySpark
Apache PySpark
آنچه باید بدانید
What you should know
1. آشنایی با اسپارک آپاچی
1. Introduction to Apache Spark
اکوسیستم Apache Spark
The Apache Spark ecosystem
چرا جرقه؟
Why Spark?
منشاء جرقه و دیتابریک
Spark origins and Databricks
اجزای جرقه
Spark components
پارتیشن ها ، تحولات ، ارزیابی های تنبل و اقدامات
Partitions, transformations, lazy evaluations, and actions
2. راه اندازی فنی
2. Technical Setup
محیط آزمایشگاه را تنظیم کنید
Set up the lab environment
یک دیتابیس را بارگیری کنید
Download a dataset
واردات
Importing
3. کار با API DataFrame
3. Working with the DataFrame API
API DataFrame
The DataFrame API
کار با DataFrames
Working with DataFrames
طرحواره ها
Schemas
کار با ستون ها
Working with columns
کار با ردیف ها
Working with rows
راه حل
Solution
4. توابع
4. Functions
توابع داخلی
Built-in functions
کار با خرما
Working with dates
توابع تعریف شده توسط کاربر
User-defined functions
کار با پیوستن
Working with joins
چالش
Challenge
چالش
Challenge
راه حل
Solution
5. مجموعه داده های توزیع شده انعطاف پذیر (RDDs)
5. Resilient Distributed Datasets (RDDs)
مشاور متمرکز بر علوم داده ، هوش مصنوعی و داده های بزرگ
جاناتان فرناندس برای یک مشاور کار می کند و در درجه اول روی علوم داده ، هوش مصنوعی و داده های بزرگ تمرکز دارد.
جاناتان از کار خود لذت می برد ، زیرا عشق او به اعداد ، کدگذاری و آمار را ترکیبی می کند. جاناتان دارای مدرک کارشناسی علوم کامپیوتر و MBA از دانشگاه وارویک است.
نمایش نظرات