این دوره به شما یاد می دهد که چگونه از ویژگی های آپاچی کافکا 3.0 استفاده کنید.
بیاموزید که چگونه داده ها را با استفاده از پلتفرم نسل بعدی داده های بزرگ - Apache Spark برش دهید و تاس کنید!
این دوره به شما می آموزد که چگونه عملکرد خوشه های Spark را در Azure Databricks با شناسایی و کاهش مسائل مختلف مانند مشکلات دریافت داده ها و گلوگاه های عملکرد بهینه کنید.
این دوره به شما می آموزد که چگونه از پنجره سازی، واترمارکینگ و پیوستن به عملیات جریان داده در Spark برای موارد استفاده خاص خود استفاده کنید.
این دوره به شما می آموزد که تکنیک های مهمی را برای تجزیه و تحلیل پیش بینی کننده مانند رگرسیون و طبقه بندی با استفاده از Apache Spark MLlib بر روی Databricks درک و پیاده سازی کنید.
این دوره به شما می آموزد که چگونه از انتزاعات Spark برای استریم داده ها استفاده کنید و با استفاده از API های جریان ساختار یافته Spark در Azure Databricks، روی داده های جریانی تبدیل کنید.
این دوره به شما یاد می دهد که چگونه داده های دسته ای را با استفاده از Apache Spark در پلتفرم Azure Databricks با استفاده از پرس و جوهای انتخاب، فیلتر و تجمیع، توابع داخلی و تعریف شده توسط کاربر تبدیل و جمع آوری کنید و پنجره سازی و پیوستن را انجام دهید.
این دوره شما را با پرس و جوهای تحلیلی و پردازش داده های بزرگ با استفاده از Apache Spark در Azure Databricks آشنا می کند. شما یاد خواهید گرفت که چگونه با استفاده از Databricks Runtime با تبدیل ها، اقدامات، تجسم ها و توابع Spark کار کنید.
با نحوه پردازش داده های بزرگ با استفاده از Databricks & Apache Spark 2.4 و 3.0.0 - DataFrame API و Spark SQL آشنا شوید
نحوه کار ، تجسم و ارائه داده ها با استفاده از Apache Spark را بیاموزید.
Master Python و PySpark 3.0.1 برای مهندسی داده/تجزیه و تحلیل (Databricks)
مفاهیم اصلی Apache Pinot را بیاموزید که یک پایگاه داده جدید Realtime Analytics است و همچنین با Hands On Examples کار کنید.