به دوره جامع ما در مورد گواهینامه دانشیار مهندسی یادگیری ماشین گواهی شده Databricks خوش آمدید. این دوره برای کمک به شما در تسلط بر مهارت های مورد نیاز برای تبدیل شدن به یک همکار تایید شده مهندس Databricks ML طراحی شده است.
Databricks یک پلت فرم تجزیه و تحلیل داده مبتنی بر ابر است که رویکردی یکپارچه برای پردازش داده، یادگیری ماشین و تجزیه و تحلیل ارائه می دهد. با تقاضای فزاینده برای مهندسان داده، Databricks به یکی از پرطرفدارترین مهارت ها در صنعت تبدیل شده است.
نامزد با حداقل صلاحیت باید بتواند:
استفاده از Databricks Machine Learning و قابلیتهای آن در جریانهای کاری یادگیری ماشین، از جمله:
آموزش ماشینی دادهها (خوشهها، مخازن، مشاغل)
Databricks Runtime for Machine Learning (مبانی، کتابخانه ها)
AutoML (طبقه بندی، رگرسیون، پیش بینی)
فروشگاه ویژگی (اصول)
MLflow (ردیابی، مدلها، رجیستری مدل)
تصمیمات صحیح را در جریان کار یادگیری ماشین اجرا کنید، از جمله:
تجزیه و تحلیل داده های اکتشافی (آمار خلاصه، حذف موارد پرت)
مهندسی ویژگی (انتقال مقدار از دست رفته، رمزگذاری یکباره)
تنظیم (اصول فراپارامتر، موازی سازی فراپارامتر)
ارزیابی و انتخاب (اعتبار متقابل، معیارهای ارزیابی)
راهحلهای یادگیری ماشین را در مقیاس با استفاده از Spark ML و ابزارهای دیگر پیادهسازی کنید، از جمله:
مفاهیم ML توزیع شده
APIهای مدلسازی Spark ML (تقسیم داده ها، آموزش، ارزیابی، برآوردگرها در مقابل ترانسفورماتورها، خطوط لوله)
Hyperopt
Pandas API در Spark
Pandas UDF و Pandas Function API
ویژگیهای مقیاسبندی پیشرفته مدلهای یادگیری ماشین کلاسیک را درک کنید، از جمله:
رگرسیون خطی توزیع شده
درختان تصمیم توزیع شده
روشهای ترکیبی (کیسه کردن، تقویت)
توسعه دهنده نرم افزار | من می خواهم زندگی و درآمد شما را بهبود بخشم.
Vijay Gadhaveدانشمند داده و توسعه دهنده نرم افزار
نمایش نظرات