آموزش فریم‌ورک‌های پردازش استریم: Apache Spark Structured Streaming - آخرین آپدیت

دانلود Stream Processing Frameworks: Apache Spark Structured Streaming

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: داده‌های استریمینگ در همه جا حضور دارند، از تراکنش‌های مالی گرفته تا کلیک‌استریم‌ها، اما مدیریت آن‌ها در مقیاس بالا نیازمند فریم‌ورک‌های تخصصی است. در این دوره آموزشی با عنوان «فریم‌ورک‌های پردازش استریم: Apache Spark Structured Streaming»، شما توانایی ساخت خط لوله‌های (Pipelines) استریمینگ قابل اعتماد و مقیاس‌پذیر را کسب خواهید کرد. در ابتدا، مدل micro-batch در Spark Structured Streaming، از جمله تریگرها (Triggers)، واترمارک‌ها (Watermarks) و ویژگی‌های تأخیر (Latency) و نرخ انتقال (Throughput) را بررسی خواهید کرد. سپس، خواهید آموخت که چگونه اسپارک جریان‌های کاری بلادرنگ (Real-time workflows) را با استفاده از DataFrames نامحدود، اجرای افزایشی، بازیابی چک‌پوینت، عملیات استریمینگ و یکپارچه‌سازی با منابعی مانند Kafka و مقصدهایی مانند Delta Lake فعال می‌کند. در نهایت، یاد می‌گیرید که میزان مناسب بودن اسپارک را برای حجم‌های کاری مختلف ارزیابی کنید، آن را با سایر فریم‌ورک‌ها مقایسه نمایید و نقش آن را در معماری‌های مدرن داده‌ها درک کنید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم از Apache Spark Structured Streaming را برای طراحی، پیاده‌سازی و ارزیابی راهکارهای استریمینگ به دست خواهید آورد.

سرفصل ها و درس ها

درک مدل Micro batch در Spark Structured Streaming Understanding the Micro-batch Model of Spark Structured Streaming

  • میکرو-بچینگ (Micro batching) چیست؟ What Is Micro-batching?

  • نحوه اجرای جاب‌های استریمینگ در اسپارک How Spark Executes Streaming Jobs

  • تریگرها در Spark Structured Streaming Triggers in Spark Structured Streaming

  • واترمارکینگ در اسپارک Watermarking in Spark

  • ویژگی‌های تأخیر و نرخ انتقال (Latency and Throughput) Latency and Throughput Characteristics

  • موردهای کاربردی پردازش بلادرنگ Real-time Processing Use Cases

نحوه فعال‌سازی جریان‌های کاری پردازش استریم توسط Spark Structured Streaming How Spark Structured Streaming Enables Stream Processing Workflows

  • داده‌های استریمینگ به عنوان DataFrames/Datasets نامحدود Streaming Data as Unbounded DataFrames/Datasets

  • دمو: دریافت داده از Kafka به DataFrame Demo: Ingest from Kafka into DataFrame

  • اجرای افزایشی، وضعیت (State) و چک‌پوینتینگ Incremental Execution, State, and Checkpointing

  • دمو: بازیابی چک‌پوینت Demo: Checkpoint Recovery

  • تریگرها و واترمارک‌ها در جریان‌های کاری Triggers and Watermarks in Workflows

  • دمو: تریگرها در عمل Demo: Triggers in Action

  • دمو: تجمیع پنجره‌ای با استفاده از واترمارک‌ها Demo: Windowed Aggregation with Watermarks

  • عملیات استریمینگ در اسپارک Streaming Operations in Spark

  • دمو: عملیات استریمینگ (فیلتر، تجمیع و Join) Demo: Streaming Operations (Filter, Aggregations, Joins)

  • منابع ورودی (Sources) و مقصدهای خروجی (Sinks) در اسپارک Input Sources and Output Sinks in Spark

  • دمو: خط لوله (Pipeline) جامع انتها به انتها Demo: End-to-end Pipeline

بررسی مناسب بودن Spark Structured Streaming برای حجم‌های کاری مختلف Suitability of Spark Structured Streaming for Different Workloads

  • چه زمانی اسپارک انتخاب مناسبی است و چه زمانی نیست؟ When Spark Is a Good Fit vs. Not

  • بهای عملکردی و سبک‌های تبادل (Performance Trade-offs) Performance Trade-offs

  • تضمین‌های تحویل داده و مقایسه‌ها Delivery Guarantees and Comparisons

  • نقاط قوت محیط‌های یکپارچه Batch و Stream Strengths of Unified Batch and Stream Environments

  • نقش اسپارک در معماری‌های گسترده‌تر داده‌ها Spark’s Role in Broader Data Architectures

نمایش نظرات

آموزش فریم‌ورک‌های پردازش استریم: Apache Spark Structured Streaming
جزییات دوره
1h 4m
22
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
2
از 5
دارد
دارد
دارد
Tejprakash
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Tejprakash Tejprakash

تِج‌پراکاش مهندس نرم‌افزار با پایه قوی در توسعه بک‌اند است که در حال حاضر در تقاطع امنیت IoT و مهندسی داده فعالیت می‌کند. تمرکز او بر طراحی سیستم‌های امن و با کارایی بالا است که داده‌های مقیاس‌بزرگ را در لحظه پردازش می‌کنند. او با تخصص در Java، Python، Apache Spark و پلتفرم‌های ابری، دیدگاهی کاربردی و امنیت‌محور را به سیستم‌های بک‌اند و داده‌ها می‌آورد. او دانش خود را از طریق وبلاگ‌های فنی در Medium در زمینه‌های مهندسی داده، توسعه بک‌اند و امنیت به اشتراک می‌گذارد و با شرکت در گردهمایی‌های محلی، فعالانه با جامعه تکنولوژی در ارتباط است. تج‌پراکاش مشتاق به ساخت سیستم‌هایی است که از نظر طراحی، کارآمد، منعطف و امن باشند.