به عنوان بخشی از این دوره آموزشی، ساخت خطوط لوله جریان را با ادغام کافکا و جریان ساختار یافته اسپارک یاد خواهید گرفت. اجازه دهید جزئیات مربوط به آنچه در این دوره پوشش داده شده است را بررسی کنیم.
اول از همه، ما باید محیط مناسبی برای ایجاد خطوط لوله جریان با استفاده از Kafka و Spark Structured Streaming در بالای Hadoop یا هر سیستم فایل توزیع شده دیگری داشته باشیم. به عنوان بخشی از دوره، شما با راهاندازی یک آزمایشگاه خود-پشتیبانی با تمام مؤلفههای کلیدی مانند Hadoop، Hive، Spark و Kafka روی یک سیستم مبتنی بر لینوکس تک نود شروع میکنید.
پس از تنظیم محیط، جزئیات مربوط به شروع کار با کافکا را بررسی خواهید کرد. به عنوان بخشی از این فرآیند، شما یک موضوع کافکا ایجاد میکنید، پیامهایی را در آن موضوع تولید میکنید و همچنین پیامهایی را از آن موضوع مصرف میکنید.
همچنین یاد خواهید گرفت که چگونه از Kafka Connect برای وارد کردن دادهها از گزارشهای وب سرور به مبحث کافکا و همچنین وارد کردن دادههای مبحث کافکا به HDFS به عنوان یک سینک استفاده کنید.
هنگامی که کافکا را از منظر دریافت داده درک کردید، مروری بر برخی از مفاهیم کلیدی مرتبط با جریان ساختاری جرقه خواهید داشت.
پس از یادگیری مجزای پخش جریانی Kafka و Spark Structured، یک خط لوله استریم برای مصرف دادههای موضوع کافکا با استفاده از Spark Structured Streaming ایجاد میکنید، سپس پردازش میکنید و برای اهداف مختلف مینویسید.
همچنین میآموزید که چگونه از پردازش دادههای افزایشی با استفاده از Spark Structured Streaming مراقبت کنید.
طرح کلی دوره
در اینجا خلاصه ای از دوره ارائه شده است. میتوانید Cloud9 یا GCP را برای ارائه سروری برای تنظیم محیط انتخاب کنید.
تنظیم محیط با استفاده از AWS Cloud9 یا GCP
تنظیم خوشه Hadoop Single Node
Hive and Spark را در بالای Single Node Hadoop Cluster راه اندازی کنید
تنظیم خوشه کافکا تک گره در بالای خوشه هادوپ تک گره
شروع کار با کافکا
حذف داده ها با استفاده از Kafka Connect - فایل های گزارش سرور وب به عنوان منبعی برای موضوع کافکا
حذف داده با استفاده از Kafka Connect - Kafka Topic به HDFS a sink
نمای کلی جریان ساختار یافته Spark
یکپارچه سازی جریان ساختار یافته کافکا و اسپارک
بارهای افزایشی با استفاده از جریان ساختاری Spark
پشتیبانی مبتنی بر Udemy
درصورتیکه در حین گذراندن دوره با چالشهای فنی مواجه شدید، نگرانیهای خود را با استفاده از مسنجر Udemy مطرح کنید. ما مطمئن می شویم که این مشکل در 48 ساعت حل می شود.
مشاور فناوری و Evangelist 13 سال تجربه در اجرای پروژه های پیچیده با استفاده از مجموعه گسترده ای از فناوری ها از جمله Big Data و Cloud. Iversity، llc - یک شرکت مستقر در ایالات متحده برای ارائه آموزش با کیفیت برای متخصصان فناوری اطلاعات و کارکنان و همچنین راه حل های مشاوره ای برای مشتریان سازمانی ، پیدا کردم. من هزاران نفر از متخصصان فناوری اطلاعات را در زمینه فن آوری های زیادی از جمله Big Data و Cloud آموزش داده ام. ایجاد حرفه ای فناوری اطلاعات برای افراد و ارائه خدمات با کیفیت به مشتریان از اهمیت بالاتری در سازمان ما برخوردار است. به عنوان یک استراتژی ورود ، ارائه آموزش با کیفیت در زمینه های ABCD خواهد بود * توسعه برنامه * داده های بزرگ و هوش تجاری * ابر * پایگاه داده ، پایگاه داده
نمایش نظرات