در این دوره، یاد خواهید گرفت که چگونه می توانید از سرویس Amazon Kinesis Data Analytics برای پردازش داده های جریانی با استفاده از زمان اجرا Apache Flink و زمان اجرا SQL استفاده کنید. شما برنامه های استریم خود را با Kinesis Data Streams ادغام خواهید کرد،...
دستکاری و مدل سازی داده ها را با Amazon SageMaker شروع کنید
تجزیه و تحلیل داده ها ، مدل سازی و پیش بینی برای بسیاری از مشاغل به طور فزاینده ای مهم است. این دوره نحوه استفاده از Stata برای یادگیری آسان مبانی داده ، مدلسازی و پیش بینی را نشان می دهد.
درک مدل سازی داده برای درک Salesforce اساسی است. این دوره به شما در مورد اشیا standard استاندارد و سفارشی ، روابط اشیا، و نحوه تصمیم گیری در مورد نیاز به ایجاد اشیا and و روابط خاص به شما می آموزد.
اجرای تجزیه و تحلیل جریان می تواند دشوار باشد. این دوره به شما می آموزد که با استفاده از Spark Strukted Streaming پردازش داده در زمان واقعی را مدلسازی کنید.
مدل واحد Apache Beam به ما امکان پردازش دسته ای و همچنین پخش جریانی داده را با استفاده از همان API می دهد. چندین مورد اجرا مانند Google Cloud Dataflow ، Apache Spark و Apache Flink با Beam سازگار هستند.
Apache Beam یک مدل واحد منبع باز برای پردازش داده های دسته ای و جریانی به روشی موازی است. خطوط لوله Beam که برای پشتیبانی از Backend Cloud Dataflow Google ساخته شده اند ، می توانند بر روی هرگونه پردازش باطله پشتیبانی شده اجرا شوند.
فاز درک اطلاعات روش CRISP-DM را برای مدل سازی پیش بینی کاوش کنید.
بیاموزید که چگونه داده ها را در R ، یکی از مهمترین ابزارهای موجود برای تجزیه و تحلیل داده ها ، یادگیری ماشین و دانش داده ، مدلسازی کنید.
این دوره متخصصان داده را که نیاز به یادگیری استراتژی های مدل سازی داده برای Azure Cosmos DB دارند و چگونگی تفاوت آنها با روش های سنتی را هدف قرار می دهد.
تکنیک ها و بهترین شیوه های نهاد-رابطه
Microsoft Ignite 2019 | مدل سازی و پارتیشن بندی داده ها در Azure Cosmos DB: آنچه که هر کاربر پایگاه داده رابطه ای باید بداند | توماس وایس