آموزش فریم‌ورک‌های پردازش استریم: Apache Spark Structured Streaming - آخرین آپدیت

دانلود Stream Processing Frameworks: Apache Spark Structured Streaming

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: داده‌های استریمینگ در همه جا حضور دارند، از تراکنش‌های مالی گرفته تا کلیک‌استریم‌ها، اما مدیریت آن‌ها در مقیاس بالا نیازمند فریم‌ورک‌های تخصصی است. در این دوره آموزشی با عنوان «فریم‌ورک‌های پردازش استریم: Apache Spark Structured Streaming»، شما توانایی ساخت خط لوله‌های (Pipelines) استریمینگ قابل اعتماد و مقیاس‌پذیر را به دست خواهید آورد. در ابتدا، مدل micro-batch در Spark Structured Streaming، از جمله تریگرها (Triggers)، واترمارک‌ها (Watermarks) و ویژگی‌های مربوط به تأخیر (Latency) و نرخ انتقال داده (Throughput) را بررسی خواهید کرد. سپس، خواهید آموخت که اسپارک چگونه جریان‌های کاری بلادرنگ را با استفاده از Unbounded DataFrames، اجرای افزایشی (Incremental Execution)، بازیابی از طریق چک‌پوینت (Checkpoint Recovery)، عملیات استریمینگ و یکپارچه‌سازی با منابعی مانند Kafka و مقصدهایی مانند Delta Lake امکان‌پذیر می‌کند. در نهایت، یاد می‌گیرید که مناسب بودن اسپارک را برای حجم‌های کاری مختلف ارزیابی کنید، آن را با سایر فریم‌ورک‌ها مقایسه نمایید و نقش آن را در معماری‌های مدرن داده درک کنید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم در زمینه Apache Spark Structured Streaming را برای طراحی، پیاده‌سازی و ارزیابی راهکارهای استریمینگ کسب خواهید کرد.

سرفصل ها و درس ها

درک مدل Micro-batch در Spark Structured Streaming Understanding the Micro-batch Model of Spark Structured Streaming

  • میکرو-بچینگ (Micro-batching) چیست؟ What Is Micro-batching?

  • نحوه اجرای جاب‌های استریمینگ در اسپارک How Spark Executes Streaming Jobs

  • تریگرها در Spark Structured Streaming Triggers in Spark Structured Streaming

  • واترمارکینگ (Watermarking) در اسپارک Watermarking in Spark

  • ویژگی‌های تأخیر و نرخ انتقال داده Latency and Throughput Characteristics

  • موردهای کاربردی پردازش بلادرنگ Real-time Processing Use Cases

چگونگی فعال‌سازی جریان‌های کاری پردازش استریم توسط Spark Structured Streaming How Spark Structured Streaming Enables Stream Processing Workflows

  • داده‌های استریمینگ به عنوان Unbounded DataFrames/Datasets Streaming Data as Unbounded DataFrames/Datasets

  • دمو: ورود داده‌ها از Kafka به DataFrame Demo: Ingest from Kafka into DataFrame

  • اجرای افزایشی، وضعیت (State) و چک‌پوینتیگ Incremental Execution, State, and Checkpointing

  • دمو: بازیابی از طریق چک‌پوینت Demo: Checkpoint Recovery

  • تریگرها و واترمارک‌ها در جریان‌های کاری Triggers and Watermarks in Workflows

  • دمو: تریگرها در عمل Demo: Triggers in Action

  • دمو: تجمیع پنجره‌ای با واترمارک‌ها Demo: Windowed Aggregation with Watermarks

  • عملیات استریمینگ در اسپارک Streaming Operations in Spark

  • دمو: عملیات استریمینگ (فیلتر، تجمیع، جوین) Demo: Streaming Operations (Filter, Aggregations, Joins)

  • منابع ورودی و مقصدهای خروجی در اسپارک Input Sources and Output Sinks in Spark

  • دمو: خط لوله جامع (End-to-End Pipeline) Demo: End-to-end Pipeline

ارزیابی مناسب بودن Spark Structured Streaming برای حجم‌های کاری مختلف Suitability of Spark Structured Streaming for Different Workloads

  • چه زمانی اسپارک انتخاب مناسبی است و چه زمانی نیست؟ When Spark Is a Good Fit vs. Not

  • بهای عملکردی (Performance Trade-offs) Performance Trade-offs

  • تضمین‌های تحویل داده و مقایسه‌ها Delivery Guarantees and Comparisons

  • نقاط قوت محیط‌های یکپارچه Batch و Stream Strengths of Unified Batch and Stream Environments

  • نقش اسپارک در معماری‌های گسترده‌تر داده Spark’s Role in Broader Data Architectures

نمایش نظرات

آموزش فریم‌ورک‌های پردازش استریم: Apache Spark Structured Streaming
جزییات دوره
1h 4m
22
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
2
از 5
دارد
دارد
دارد
Tejprakash
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Tejprakash Tejprakash

تِج‌پراکاش مهندس نرم‌افزار با پایه قوی در توسعه بک‌اند است که در حال حاضر در تقاطع امنیت IoT و مهندسی داده فعالیت می‌کند. تمرکز او بر طراحی سیستم‌های امن و با کارایی بالا است که داده‌های مقیاس‌بزرگ را در لحظه پردازش می‌کنند. او با تخصص در Java، Python، Apache Spark و پلتفرم‌های ابری، دیدگاهی کاربردی و امنیت‌محور را به سیستم‌های بک‌اند و داده‌ها می‌آورد. او دانش خود را از طریق وبلاگ‌های فنی در Medium در زمینه‌های مهندسی داده، توسعه بک‌اند و امنیت به اشتراک می‌گذارد و با شرکت در گردهمایی‌های محلی، فعالانه با جامعه تکنولوژی در ارتباط است. تج‌پراکاش مشتاق به ساخت سیستم‌هایی است که از نظر طراحی، کارآمد، منعطف و امن باشند.