آموزش یک دوره تصادف در PySpark

A Crash Course In PySpark

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: آموزش تمام اصول PySpark PySpark، Apache Spark، تجزیه و تحلیل داده های بزرگ، پردازش داده های بزرگ، پایتون پیش نیازها: آشنایی با پایتون، که می توانید از طریق دوره آموزشی "Nonsense Python" یاد بگیرید.

Spark یکی از پرتقاضاترین چارچوب‌های پردازش کلان داده در حال حاضر است.


این دوره شما را با مفاهیم اصلی PySpark آشنا می کند. ما کار خواهیم کرد تا شما را قادر کنیم بیشتر کارهایی را که در کتابخانه SQL یا Python Pandas انجام می دهید، انجام دهید، یعنی:

  • در دست گرفتن داده ها

  • مدیریت داده های از دست رفته و پاکسازی داده ها

  • جمع آوری داده های شما

  • در حال فیلتر کردن آن

  • محور کردن آن

  • و بازنویسی آن

همه این موارد به شما امکان می‌دهد از Spark در مجموعه داده‌های بزرگ استفاده کنید و شروع به دریافت ارزش از داده‌های خود کنید.

بیایید شروع کنیم.


سرفصل ها و درس ها

معرفی Introduction

  • معرفی Introduction

  • معرفی Introduction

  • ساختار این دوره چگونه است How is this course structured

معرفی Introduction

  • ساختار این دوره چگونه است How is this course structured

سناریویی برای شروع ما A Scenario To Get Us Started

  • مقدمه ای بر محیط توسعه ما Introduction to our development environment

  • مقدمه ای بر محیط توسعه ما Introduction to our development environment

  • معرفی مجموعه داده و چارچوب های داده ما Introduction to our dataset & dataframes

  • معرفی مجموعه داده و چارچوب های داده ما Introduction to our dataset & dataframes

  • قطعه کد پیکربندی محیط Environment configuration code snippet

  • قطعه کد پیکربندی محیط Environment configuration code snippet

  • بلع و تمیز کردن داده ها Ingesting & Cleaning Data

  • پاسخ به سوالات سناریویی ما Answering our scenario questions

سناریویی برای شروع ما A Scenario To Get Us Started

  • بلع و تمیز کردن داده ها Ingesting & Cleaning Data

  • پاسخ به سوالات سناریویی ما Answering our scenario questions

مفاهیم اصلی Core Concepts

  • آوردن داده ها به دیتافریم Bringing data into dataframes

  • بازرسی یک Dataframe Inspecting A Dataframe

  • مدیریت مقادیر تهی و تکراری Handling Null & Duplicate Values

  • انتخاب و فیلتر کردن داده ها Selecting & Filtering Data

  • انتخاب و فیلتر کردن داده ها Selecting & Filtering Data

  • اعمال فیلترهای متعدد Applying Multiple Filters

  • اعمال فیلترهای متعدد Applying Multiple Filters

  • اجرای SQL روی Dataframes Running SQL on Dataframes

  • اضافه کردن ستون های محاسبه شده Adding Calculated Columns

  • گروه بر اساس و تجمع Group By And Aggregation

  • گروه بر اساس و تجمع Group By And Aggregation

  • نوشتن Dataframe در فایل ها Writing Dataframe To Files

  • نوشتن Dataframe در فایل ها Writing Dataframe To Files

مفاهیم اصلی Core Concepts

  • آوردن داده ها به دیتافریم Bringing data into dataframes

  • بازرسی یک Dataframe Inspecting A Dataframe

  • مدیریت مقادیر تهی و تکراری Handling Null & Duplicate Values

  • اجرای SQL روی Dataframes Running SQL on Dataframes

  • اضافه کردن ستون های محاسبه شده Adding Calculated Columns

چالش Challenge

  • بررسی اجمالی چالش Challenge Overview

  • راه حل چالش Challenge Solution

  • راه حل چالش Challenge Solution

چالش Challenge

  • بررسی اجمالی چالش Challenge Overview

نتیجه Conclusion

  • از اینکه برای یادگیری PySpark به من ملحق شدید متشکریم! Thanks for joining me to learn PySpark!

نتیجه Conclusion

  • از اینکه برای یادگیری PySpark به من ملحق شدید متشکریم! Thanks for joining me to learn PySpark!

نمایش نظرات

آموزش یک دوره تصادف در PySpark
جزییات دوره
1.5 hours
19
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
9,923
4.5 از 5
دارد
دارد
دارد
Kieran Keene
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kieran Keene Kieran Keene

مهندس داده در Kodey