پروژه یادگیری ماشین اسپارک (پیشبینی ساییدگی کارکنان) برای مبتدیان با استفاده از Databricks Notebook (غیر رسمی) (سرور نسخه انجمن)
در این پروژه یادگیری ماشینی علم داده، پروژه پیشبینی ساییدگی کارکنان را با استفاده از الگوریتم طبقهبندی درخت تصمیم یکی از مدلهای پیشبینی ایجاد میکنیم.
Apache Spark و Machine Learning را در پلتفرم Databricks کاوش کنید.
راه اندازی Spark Cluster
یک خط لوله داده ایجاد کنید
آن داده ها را با استفاده از مدل یادگیری ماشین (کتابخانه Spark ML) پردازش کنید
یادگیری عملی
مورد استفاده در زمان واقعی
برای تحت تاثیر قرار دادن استخدام کننده خود، پروژه را در وب منتشر کنید
نمایش گرافیکی داده ها با استفاده از دفترچه یادداشت Databricks.
داده های ساخت یافته را با استفاده از SparkSQL و DataFrames تغییر دهید
پیشبینی ساییدگی کارکنان یک مورد استفاده در زمان واقعی در Apache Spark
درباره Databricks:
Databricks به شما امکان می دهد فوراً شروع به نوشتن کد Spark ML کنید تا بتوانید روی مشکلات داده خود تمرکز کنید.
مهندس Bigdata من معمار راه حل هستم با 12 سال تجربه در صنعت بانکداری ، ارتباطات از راه دور و خدمات مالی در طیف متنوعی از نقش ها در برنامه های کارت اعتباری ، پرداخت ها ، انبار داده و مرکز داده نقش من به عنوان Bigdata و Cloud Architect به عنوان بخشی از تیم Bigdata برای ارائه راه حل نرم افزاری کار می کنم. مسئولیت ها شامل - از همه مسائل مربوط به Hadoop پشتیبانی کنید - معیار سیستم های موجود ، تجزیه و تحلیل چالش های سیستم موجود/گلوگاه ها و پیشنهاد راه حل های مناسب برای از بین بردن آنها بر اساس فن آوری های مختلف Big Data - تجزیه و تحلیل و تعریف جوانب مثبت و منفی فناوری ها و سیستم عامل های مختلف - موارد استفاده ، راه حل ها و توصیه ها را تعریف کنید - استراتژی Big Data را تعریف کنید - انجام تجزیه و تحلیل دقیق از مشکلات کسب و کار و محیط های فنی - راه حل عملی بزرگ داده را بر اساس تجزیه و تحلیل نیازهای مشتری تعریف کنید - توصیه های عملی Big Big Cluster را تعریف کنید - به مشتریان در مورد فن آوری های مختلف Big Data آموزش دهید تا به آنها در درک نکات مثبت و منفی Big Data کمک کند - حاکمیت داده ها - ساخت ابزارهایی برای بهبود بهره وری توسعه دهنده و اجرای روشهای استاندارد
نمایش نظرات