آموزش بهینه‌سازی عملکرد و نرخ انتقال داده در آپاچی اسپارک (Spark) - آخرین آپدیت

دانلود Optimize Spark Performance & Throughput

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: در محیط‌های مهندسی داده در مقیاس بزرگ، مشکلاتی نظیر کندی در تبدیل داده‌ها (Transformations)، عملیات Shuffle بیش از حد و توزیع نامتوازن بار کاری می‌تواند بر تحلیل‌ها، گزارش‌دهی و تعهدات SLA تأثیر منفی بگذارد. این دوره به شما می‌آموزد چگونه برنامه‌های Apache Spark را تحلیل، عیب‌یابی و بهینه‌سازی کنید تا با سرعت بیشتر، بازدهی بالاتر و پایداری بیشتری اجرا شوند. در این دوره، ابتدا با مبانی اجرای جاب‌های اسپارک، از جمله نحوه عملکرد Stages، Tasks، عملیات Shuffle و نقش Execution Plans در شناسایی گلوگاه‌ها آشنا می‌شوید. سپس ابزارهای مانیتورینگ داخلی اسپارک را برای تفسیر رفتار جاب‌ها بررسی خواهید کرد. پس از آن، تکنیک‌های عملی بهینه‌سازی از جمله بهبود پارتیشن‌بندی داده‌ها، کاهش اثر Data Skew (انحراف داده‌ها)، بهینه‌سازی Joinها، پیکربندی استراتژی‌های Caching و انتخاب فرمت‌های بهینه فایل را پیاده‌سازی می‌کنید. همچنین یاد می‌گیرید چگونه Executorها، حافظه، هسته‌ها (Cores) و Dynamic Allocation را برای ایجاد تعادل بین هزینه و عملکرد تنظیم کنید. پیش‌نیازها: آشنایی مقدماتی با زبان پایتون، Spark DataFrames، JSON و SQL. مخاطبان: این دوره برای مهندسان داده و توسعه‌دهندگانی طراحی شده است که نیاز به عیب‌یابی و بهینه‌سازی جاب‌های اسپارک در خط لوله‌های داده توزیع‌شده در مقیاس بزرگ دارند. در پایان این دوره، شما مهارت‌های لازم برای اعمال استراتژی‌های پیشرفته تنظیم (Tuning)، افزایش نرخ انتقال داده (Throughput)، کاهش سربار Shuffle و بهینه‌سازی مصرف منابع را به‌طور کامل کسب خواهید کرد.

سرفصل ها و درس ها

تحلیل اجرای جاب‌های اسپارک و متریک‌ها Analyzing Spark Job Execution & Metrics

  • خوش‌آمدگویی و آنچه خواهید آموخت Welcome & What You Will Learn

  • درک نحوه اجرای جاب در اسپارک Understanding Spark Job Execution

  • متریک‌های کلیدی برای شناسایی گلوگاه‌ها Key Metrics for Diagnosing Bottlenecks

  • دموی عملی: استفاده از Spark UI برای شناسایی مشکلات Case Demo: Using Spark UI to Spot Issues

رفع مشکل Data Skew، چالش‌های Shuffle و Joinهای ناکارآمد Fixing Data Skew, Shuffle Issues & Inefficient Joins

  • درک مفهوم Data Skew و Shuffle Understanding Data Skew & Shuffle

  • استراتژی‌های پارتیشن‌بندی برای توزیع متوازن بار کاری Partitioning Strategies for Balanced Workloads

  • کاربرد AQE: بهینه‌سازی خودکار طرح‌های کوئری AQE in Action: Auto-Optimizing Query Plans

تنظیم Executorها، حافظه و موازی‌سازی برای دستیابی به SLA Tuning Executors, Memory & Parallelism to Meet SLAs

  • درک مفاهیم Executorها، هسته‌ها و حافظه Understanding Executors, Cores & Memory

  • تخصیص پویا (Dynamic Allocation) و تنظیم موازی‌سازی Dynamic Allocation & Parallelism Tuning

  • دموی عملی: تنظیم یک جاب برای رعایت استانداردهای SLA Case Demo: Tuning a Job to Meet SLA

  • جمع‌بندی دوره و گام‌های بعدی Course Wrap-Up & Next Steps

نمایش نظرات

آموزش بهینه‌سازی عملکرد و نرخ انتقال داده در آپاچی اسپارک (Spark)
جزییات دوره
4h 11m
11
(آخرین آپدیت)
111
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده