لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش بهینهسازی عملکرد و نرخ انتقال داده در آپاچی اسپارک (Spark)
- آخرین آپدیت
دانلود Optimize Spark Performance & Throughput
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
در محیطهای مهندسی داده در مقیاس بزرگ، مشکلاتی نظیر کندی در تبدیل دادهها (Transformations)، عملیات Shuffle بیش از حد و توزیع نامتوازن بار کاری میتواند بر تحلیلها، گزارشدهی و تعهدات SLA تأثیر منفی بگذارد. این دوره به شما میآموزد چگونه برنامههای Apache Spark را تحلیل، عیبیابی و بهینهسازی کنید تا با سرعت بیشتر، بازدهی بالاتر و پایداری بیشتری اجرا شوند.
در این دوره، ابتدا با مبانی اجرای جابهای اسپارک، از جمله نحوه عملکرد Stages، Tasks، عملیات Shuffle و نقش Execution Plans در شناسایی گلوگاهها آشنا میشوید. سپس ابزارهای مانیتورینگ داخلی اسپارک را برای تفسیر رفتار جابها بررسی خواهید کرد. پس از آن، تکنیکهای عملی بهینهسازی از جمله بهبود پارتیشنبندی دادهها، کاهش اثر Data Skew (انحراف دادهها)، بهینهسازی Joinها، پیکربندی استراتژیهای Caching و انتخاب فرمتهای بهینه فایل را پیادهسازی میکنید. همچنین یاد میگیرید چگونه Executorها، حافظه، هستهها (Cores) و Dynamic Allocation را برای ایجاد تعادل بین هزینه و عملکرد تنظیم کنید.
پیشنیازها: آشنایی مقدماتی با زبان پایتون، Spark DataFrames، JSON و SQL.
مخاطبان: این دوره برای مهندسان داده و توسعهدهندگانی طراحی شده است که نیاز به عیبیابی و بهینهسازی جابهای اسپارک در خط لولههای داده توزیعشده در مقیاس بزرگ دارند.
در پایان این دوره، شما مهارتهای لازم برای اعمال استراتژیهای پیشرفته تنظیم (Tuning)، افزایش نرخ انتقال داده (Throughput)، کاهش سربار Shuffle و بهینهسازی مصرف منابع را بهطور کامل کسب خواهید کرد.
نمایش نظرات