در این دوره ، شما می آموزید که چگونه با Azure Machine Learning ویژگی های جدیدی را از داده ها تهیه ، تمیز و مهندسی کنید ، بنابراین مجموعه داده را می توان به شکلی نشان داد که الگوریتم یادگیری برای یادگیری الگوها آسان باشد.
این دوره شامل دسته ای از تکنیک های مهندسی ویژگی است که برای گرفتن بهترین نتیجه از یک مدل یادگیری ماشین مورد استفاده قرار می گیرد ، از جمله انتخاب ویژگی ها ، و چندین روش استخراج ویژگی برای بیان مجدد ویژگی ها به مناسب ترین شکل.
Pandas به استاندارد طلایی برای درگیری داده ها در یادگیری کاربردی ماشین تبدیل شده است. این دوره اصول درگیری داده ها را با استفاده از Pandas در پایتون به شما می آموزد ، از جمله نحو ، توابع و دستکاری در داده ها.
در مورد موارد استفاده و بهترین روش ها برای معماری برنامه های زمان واقعی با استفاده از فناوری های داده بزرگ ، مانند Hazelcast و Apache Spark اطلاعات کسب کنید.
در مورد موارد استفاده و بهترین روش ها برای معماری برنامه های حالت دسته ای با استفاده از فناوری های داده بزرگ مانند Hive و Apache Spark اطلاعات کسب کنید.
بیاموزید که چگونه Apache Spark را با سایر فناوری های داده بزرگ برای ساخت خطوط داده مهندسی داده و DevOps کار کنید.