Apache Beam یک مدل برنامه نویسی یکپارچه و قابل حمل برای موارد استفاده از داده های دسته ای و جریانی است.
قبلاً میتوانستیم Spark، Flink Cloud Dataflow Jobs را فقط روی خوشههای مربوطه اجرا کنیم. اما اکنون Apache Beam یک مدل برنامهنویسی قابل حمل ارائه کرده است که در آن میتوانیم خطوط لوله دادههای بزرگ را با زبان آگنوستیک بسازیم و آن را با استفاده از هر موتور داده بزرگ (Apache Spark، Flink یا در Google Cloud Platform با استفاده از Cloud Dataflow و بسیاری دیگر از موتورهای Big Data) اجرا کنیم. .
Apache Beam آینده ساخت خطوط لوله پردازش داده های بزرگ است و به دلیل قابل حمل بودن توسط شرکت های انبوه پذیرفته می شود. بسیاری از شرکت های بزرگ حتی شروع به استقرار خطوط لوله Beam در سرورهای تولید خود کرده اند.
چه چیزی در دوره گنجانده شده است؟
مفاهیم پرتو آپاچی کامل از ابتدا تا پیادهسازی بلادرنگ توضیح داده شده است.
هر مفهوم پرتو آپاچی با نمونههای عملی مناسب آن توضیح داده شده است.
حتی آن مفاهیمی را که توضیح آنها در هیچ کجای آنلاین خیلی واضح نیست، درج کنید.
نکات را تایپ کنید، رمزگشایی رمزگذاری، واترمارک، ویندوز، محرکها و بسیاری موارد دیگر.
با استفاده از مدل برنامه نویسی پرتو آپاچی، دو مطالعه موردی داده های بزرگ در زمان واقعی بسازید.
دادههای پردازششده Beam را از خط لوله Beam در Google Cloud BigQuery Tables بارگیری کنید.
کدها و مجموعه دادههای مورد استفاده در سخنرانیها برای راحتی شما در دوره پیوست شدهاند.
مهندسی داده، تجزیه و تحلیل و مربی ابری
نمایش نظرات