آموزش پردازش مقیاس‌پذیر داده‌ها با پایتون - آخرین آپدیت

دانلود Scalable Data Processing with Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: پردازش مقیاس‌پذیر داده‌ها برای مدیریت بهینه مجموعه‌داده‌های بزرگ ضروری است، اما بسیاری در بهینه‌سازی عملکرد با چالش مواجه هستند. در این دوره، «پردازش مقیاس‌پذیر داده‌ها با پایتون»، شما توانایی پردازش و مدیریت داده‌ها در مقیاس بزرگ را با استفاده از PySpark و Dask کسب خواهید کرد. در ابتدا، مبانی مقیاس‌پذیری، از جمله پردازش موازی، توزیع‌شده و دسته‌ای (Batch Processing) را بررسی می‌کنید. سپس، نحوه استفاده از PySpark برای پردازش مجموعه‌داده‌های عظیم با استفاده از تبدیلات (Transformations)، حافظه پنهان (Caching) و بهینه‌سازی‌ها را خواهید آموخت. در نهایت، یاد می‌گیرید که چگونه از Dask برای محاسبات موازی استفاده کنید و اجرای برنامه‌ها را با گراف‌های وظیفه (Task Graphs) و ارزیابی تنبل (Lazy Evaluation) بهینه نمایید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم برای پردازش بهینه داده‌های حجیم و مدیریت چالش‌های عملکردی در پردازش مقیاس‌پذیر داده‌ها را خواهید داشت.

سرفصل ها و درس ها

مبانی پردازش مقیاس‌پذیر داده‌ها Fundamentals of Scalable Data Processing

  • مقیاس‌پذیری در پردازش داده‌ها Scalability in Data Processing

  • مقایسه پارادایم‌های پردازشی Comparing Processing Paradigms

  • ابزارهای پردازش مقیاس‌پذیر Scalable Processing Tools

  • دمو: مقیاس‌بندی پردازش داده‌ها با PySpark و Dask Demo: Scaling Data Processing with PySpark and Dask

استفاده از PySpark برای پردازش داده‌های مقیاس بزرگ PySpark for Large-scale Data Processing

  • آشنایی با PySpark Introduction to PySpark

  • کار با Spark DataFrames Working with Spark DataFrames

  • تبدیلات و عملیات در Spark Transformations and Actions in Spark

  • دمو: کار عملی با PySpark Demo: Hands-on with PySpark

استفاده از Dask برای پردازش موازی Dask for Parallel Processing

  • آشنایی با Dask و محاسبات موازی Introduction to Dask and Parallel Computing

  • دیتافریم‌های Dask و دستکاری موازی داده‌ها Dask DataFrames and Parallel Data Manipulation

  • بهینه‌سازی محاسبات Optimizing Computations

  • دمو: اجرای Dask برای پردازش موازی Demo: Running Dask for Parallel Processing

مدیریت عملکرد و مقیاس‌پذیری Handle Performance and Scaling

  • شناسایی گلوگاه‌های عملکردی Identifying Performance Bottlenecks

  • بهینه‌سازی مصرف حافظه Optimizing Memory Usage

  • بنچ‌مارکینگ و پروفایلینگ Benchmarking and Profiling

  • دمو: مدیریت خطاها در اجرای توزیع‌شده Demo: Handling Failures in Distributed Execution

نمایش نظرات

آموزش پردازش مقیاس‌پذیر داده‌ها با پایتون
جزییات دوره
55m
16
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
4
از 5
دارد
دارد
دارد
Yasir Khan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Yasir Khan Yasir Khan

معامله گر فعال فارکس