لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پردازش دادههای بدون سرور با Dataflow: توسعه خطوط لوله داده (Pipeline)
- آخرین آپدیت
دانلود Serverless Data Processing with Dataflow: Develop Pipelines en Español
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
در بخش دوم از سری دورههای آموزشی Dataflow، به بررسی عمیق توسعه خطوط لوله داده با استفاده از SDK Beams میپردازیم. ابتدا با مرور مفاهیم Apache Beam شروع میکنیم و سپس پردازش دادههای جریانی (Streaming) را با استفاده از پنجرهها (Windows)، واترمارکها (Watermarks) و تریگرها تحلیل خواهیم کرد. در ادامه، گزینههای منابع (Sources) و گیرندهها (Sinks) در خطوط لوله، طرحوارهها (Schemas) برای نمایش دادههای ساختاریافته و نحوه اجرای تغییرات حالتدار با استفاده از APIهای State و Timer را بررسی میکنیم. سپس، به معرفی بهترین روشهای بهینهسازی برای حداکثر کردن کارایی خطوط لوله میپردازیم. در نهایت، نحوه استفاده از SQL و Dataframes برای پیادهسازی منطق کسبوکار در Beam و توسعه تکرارشونده خطوط لوله با استفاده از Notebookهای Beam را آموزش خواهیم داد.
سرفصل ها و درس ها
مقدمه
Introducción
معرفی دوره
Introducción al curso
مرور مفاهیم Beam
Revisión de conceptos de Beam
مفاهیم پایه Beam
Conceptos básicos de Beam
ترانسفورمیشنهای کاربردی
Transformaciones de utilidad
چرخه حیات DoFn
Ciclo de vida de DoFn
شروع کار با گوگل کلود و Qwiklabs
Empezar a usar Google Cloud y Qwiklabs
پنجرهها، واترمارکها و تریگرها
Ventanas, marcas de agua y activadores
پنجرهها (Windows)
Ventanas
واترمارکها (Watermarks)
Marcas de agua
تریگرها (Triggers)
Activadores
منابع و گیرندهها
Fuentes y receptores
منابع و گیرندهها
Fuentes y receptores
ورودی و خروجی Text و File
E/S de Text y de File
ورودی و خروجی BigQuery
E/S de BigQuery
ورودی و خروجی PubSub
E/S de PubSub
ورودی و خروجی Kafka
E/S de Kafka
ورودی و خروجی BigTable
E/S de BigTable
ورودی و خروجی Avro
E/S de Avro
قابلیت تقسیم DoFn
DoFn divisible
طرحوارهها
Esquemas
طرحوارههای Beam
Esquemas de Beam
نمونههای کدنویسی
Ejemplos de código
حالت و تایمرها
Estado y Temporizadores
رابط برنامهنویسی State API
API de State
رابط برنامهنویسی Timer API
API de Timer
جمعبندی
Resumen
بهترین روشهای بهینهسازی
Prácticas Recomendadas
طرحوارهها
Esquemas
مدیریت دادههای غیرقابل پردازش
Manejo de los datos que no se pueden procesar
مدیریت خطاها
Manejo de errores
تولیدکننده کد AutoValue
Generador de código AutoValue
مدیریت دادههای JSON
Manejo de datos JSON
بهرهگیری از چرخه حیات DoFn
Utilización del ciclo de vida de DoFn
بهینهسازی خطوط لوله
Optimizaciones para canalizaciones
SQL و DataFrames در Dataflow
Dataflow SQL y DataFrames
نمایش نظرات