آموزش بهینه سازی عملکرد در آپاچی اسپارک

دانلود Performance Optimization in Apache Spark

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: بهینه‌سازی کارآمد عملکرد برای مقیاس‌بندی مؤثر جریان‌های کاری Apache Spark بسیار مهم است. در این دوره، بهینه سازی عملکرد در آپاچی اسپارک، شما توانایی بهینه سازی برنامه های Spark را برای مدیریت چالش های پردازش داده در مقیاس بزرگ به دست خواهید آورد. ابتدا، استراتژی های پارتیشن بندی را برای توزیع کارآمد بارهای کاری و کاهش به هم زدن داده ها در حین یادگیری تکنیک هایی مانند تبدیل های گسترده و باریک بررسی خواهید کرد. در مرحله بعد، متوجه خواهید شد که چگونه حافظه پنهان و ماندگاری می‌تواند پردازش تکراری را بهبود بخشد، همراه با استراتژی‌های اتصال مؤثر مانند اتصال پخش و سطل برای افزایش عملکرد در مجموعه داده‌های بزرگ. در نهایت، یاد خواهید گرفت که از ویژگی های اجرای پرس و جو تطبیقی ​​(AQE) استفاده کنید، از جمله ادغام پارتیشن پویا، انتخاب پیوستن پویا، و مدیریت انحراف داده ها برای بهینه سازی یکپارچه پرس و جوهای پیچیده. پس از اتمام این دوره، مهارت ها و دانش Apache Spark مورد نیاز برای ایجاد گردش کار کارآمد و مقیاس پذیر برای چالش های داده های بزرگ در دنیای واقعی را خواهید داشت.

سرفصل ها و درس ها

استراتژی های پارتیشن بندی و ذخیره داده ها Partitioning Strategies and Data Caching

  • آشنایی با پارتیشن های اسپارک و ترکیب داده ها Understanding Spark Partitions and Data Shuffling

  • نسخه ی نمایشی: انجام تبدیل های گسترده و باریک Demo: Performing Wide and Narrow Transformations

  • نسخه ی نمایشی: استفاده از repartition و coalesce برای کنترل پارتیشن Demo: Using repartition and coalesce for Partition Control

  • نسخه ی نمایشی: تجسم مخلوط کردن داده ها با ابزارهای مانیتورینگ Demo: Visualizing Data Shuffling with Monitoring Tools

  • نسخه ی نمایشی: Spark Caching و Persistence Demo: Spark Caching and Persistence

بهینه سازی جوین ها و پرس و جوها Optimizing Joins and Queries

  • بررسی اتصالات کارآمد و اجرای پرس و جو تطبیقی ​​در Spark Exploring Efficient Joins and Adaptive Query Execution in Spark

  • نسخه ی نمایشی: پیاده سازی Broadcast Joins Demo: Implementing Broadcast Joins

  • نسخه ی نمایشی: بهینه سازی اتصالات با Bucketing Demo: Optimizing Joins with Bucketing

  • نسخه ی نمایشی: مدیریت اتصالات کج با اجرای پرس و جو تطبیقی Demo: Handling Skewed Joins with Adaptive Query Execution

  • نسخه ی نمایشی: استفاده از انتخاب پیوستن پویا Demo: Utilizing Dynamic Join Selection

  • نسخه ی نمایشی: استفاده از ادغام پارتیشن پویا Demo: Applying Dynamic Partition Coalescing

نمایش نظرات

آموزش بهینه سازی عملکرد در آپاچی اسپارک
جزییات دوره
39m
11
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Pinal Dave
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Pinal Dave Pinal Dave

Pinal Dave یک متخصص تنظیم عملکرد SQL سرور و یک مشاور مستقل است. وی 11 کتاب پایگاه داده SQL Server ، 25 دوره Pluralsight را تألیف کرده و بیش از 5000 مقاله در زمینه فناوری پایگاه داده در وبلاگ خود در https://blog.sqlauthority.com نوشته است. وی همراه با 16 سال تجربه عملی ، دارای مدرک کارشناسی ارشد علوم و تعدادی گواهینامه پایگاه داده است.