آموزش تبدیل داده ها با استفاده از PySpark

دانلود Transform Data Using PySpark

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: دستکاری کارآمد داده ها برای پردازش موثر مجموعه داده های مقیاس بزرگ بسیار مهم است. در این دوره، تبدیل داده ها با استفاده از PySpark، شما توانایی دستکاری، تمیز کردن و تجزیه و تحلیل مجموعه داده های بزرگ را با استفاده از PySpark به دست خواهید آورد. ابتدا نحوه خواندن و نوشتن داده ها با استفاده از فرمت های مختلف با مشخصات طرحواره را بررسی خواهید کرد. در مرحله بعد، نحوه انجام تبدیل‌های پیشرفته، از جمله گروه‌بندی، پیوستن، و توابع پنجره و همچنین انجام وظایف پاکسازی داده‌ها مانند مدیریت مقادیر از دست رفته، تهی و تکراری را خواهید یافت. در نهایت، نحوه ایجاد توابع سفارشی، از جمله UDFها، UDTFها، و UDFهای برداری شده را خواهید آموخت تا عملکرد PySpark را برای نیازهای تحلیلی خاص گسترش دهید. وقتی این دوره را به پایان رساندید، مهارت ها و دانش PySpark مورد نیاز برای ایجاد گردش کار کارآمد و قابل استفاده مجدد برای هر چالش مبتنی بر داده را خواهید داشت.

سرفصل ها و درس ها

دستکاری داده ها را با PySpark انجام دهید Perform Data Manipulations with PySpark

  • دستکاری داده ها در PySpark Data Manipulations in PySpark

  • نسخه ی نمایشی: خواندن و نوشتن داده ها با مشخصات طرحواره Demo: Reading and Writing Data with Schema Specification

  • نسخه ی نمایشی: انتخاب و فیلتر کردن داده ها Demo: Selecting and Filtering Data

  • نسخه ی نمایشی: افزودن، اصلاح و رها کردن ستون ها Demo: Adding, Modifying, and Dropping Columns

  • نسخه ی نمایشی: گروه بندی و جمع آوری داده ها Demo: Grouping and Aggregating Data

  • نسخه ی نمایشی: انجام عملیات پیوستن Demo: Performing Join Operations

  • نسخه ی نمایشی: تنظیم عملیات در PySpark Demo: Setting Operations in PySpark

  • نسخه ی نمایشی: استفاده از توابع پنجره در PySpark Demo: Using Window Functions in PySpark

پاکسازی داده ها و ایجاد توابع سفارشی با PySpark Perform Data Cleaning and Create Custom Functions with PySpark

  • نسخه ی نمایشی: مدیریت داده های گمشده در PySpark Demo: Handling Missing Data in PySpark

  • نسخه ی نمایشی: مدیریت داده های پوچ در PySpark Demo: Handling Null Data in PySpark

  • نسخه ی نمایشی: مدیریت داده های تکراری در PySpark Demo: Handling Duplicate Data in PySpark

  • نسخه ی نمایشی: نوشتن و استفاده از UDF در PySpark Demo: Writing and Using UDFs in PySpark

  • نسخه ی نمایشی: استفاده از UDTF برای تبدیل های پیشرفته Demo: Using UDTFs for Advanced Transformations

  • نسخه ی نمایشی: ایجاد و استفاده از UDF های برداری شده Demo: Creating and Using Vectorized UDFs

نمایش نظرات

آموزش تبدیل داده ها با استفاده از PySpark
جزییات دوره
43m
14
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Pinal Dave
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Pinal Dave Pinal Dave

Pinal Dave یک متخصص تنظیم عملکرد SQL سرور و یک مشاور مستقل است. وی 11 کتاب پایگاه داده SQL Server ، 25 دوره Pluralsight را تألیف کرده و بیش از 5000 مقاله در زمینه فناوری پایگاه داده در وبلاگ خود در https://blog.sqlauthority.com نوشته است. وی همراه با 16 سال تجربه عملی ، دارای مدرک کارشناسی ارشد علوم و تعدادی گواهینامه پایگاه داده است.