Beginning of dialog window. Escape will cancel and close the window.
End of dialog window.
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
جریان ساختاری موتور پردازش جریان مقیاس پذیر و متحمل خطا در Apache Spark 2 است. فریم داده ها در Spark 2.x از داده های بی نهایت پشتیبانی می کنند ، بنابراین به طور موثر برنامه های دسته ای و جریان را متحد می کند. برنامه های پردازش جریان با داده های به طور مداوم به روز شده کار می کنند و به تغییرات واقعی واکنش نشان می دهند -زمان. در این دوره ، با کاوش Apache Spark Streamed Streaming API برای پردازش جریان داده ها ، شما بر استفاده از API قاب جدول جدولی و همچنین Spark SQL برای کار با مجموعه داده های بدون محدودیت با استفاده از همان API هایی که با داده های دسته ای محدود کار می کنند ، تمرکز خواهید کرد. در ابتدا ، شما پشتیبانی Spark را برای منابع مختلف داده و غرق های داده کاوش خواهید کرد ، مورد استفاده را برای هر یک درک خواهید کرد و همچنین معنای تحمل خطا را ارائه می دهید. شما داده ها را در سینک کنسول و پرونده می نویسید و منطق نوشتن خود را با غرق های foreach و foreachBatch سفارشی می کنید. در مرحله بعدی ، خواهید دید که چگونه می توانید داده های جریان را با استفاده از عملکردهایی مانند انتخاب ، پیش بینی ، گروه بندی و تجمع با استفاده از DataFrame API و همچنین Spark SQL تبدیل کنید. همچنین نحوه انجام عملیات پنجره سازی در جریان ها را با استفاده از پنجره های افتراقی و کشویی یاد خواهید گرفت. سپس عملیات پیوند رابطه ای بین منابع جریانی و دسته ای را کاوش خواهید کرد و همچنین محدودیت های پیوستن جریان در Spark را یاد خواهید گرفت. سرانجام ، پشتیبانی Spark را برای مدیریت و نظارت بر س quالات پخش جریانی با استفاده از Spark Web UI و سرور Spark History جستجو خواهید کرد. پس از اتمام این دوره ، مهارت و دانش لازم برای کار با منابع و غرقهای مختلف برای داده های جریان خود ، اعمال طیف وسیعی از عملیات پردازش در جریان های ورودی و انجام پنجره سازی و پیوستن به جریان ها را خواهید داشت.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
کاوش در منابع و غرق ها
Exploring Sources and Sinks
پیش نیازها و طرح کلی دوره
Prerequisites and Course Outline
پخش جریانی داده ها در Spark 2.x
Streaming DataFrames in Spark 2.x
منابع و غرق ها
Sources and Sinks
نسخه ی نمایشی: تنظیم محیط
Demo: Environment Setup
نسخه ی نمایشی: سینک ظرفشویی
Demo: Console Sink
نسخه ی نمایشی: File Sink با پرونده های CSV و JSON
Demo: File Sink with CSV and JSON Files
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات