Apache Spark با Scala برای گواهینامه Databricks مفید است (غیر رسمی)
Apache Spark با اسکالا یک دوره آموزشی کرش برای علاقه مندان به گواهینامه Databricks (غیر رسمی) برای مبتدیان است
تجزیه و تحلیل «دادههای بزرگ» یک مهارت داغ و بسیار ارزشمند است – و این دوره به شما داغترین فناوری در دادههای بزرگ را آموزش میدهد: Apache Spark. کارفرمایان از جمله آمازون، eBay، ناسا، یاهو و بسیاری دیگر. همه از Spark استفاده میکنند. برای استخراج سریع معنی از مجموعه داده های عظیم در یک خوشه Hadoop مقاوم در برابر خطا. شما همان تکنیک ها را با استفاده از سیستم عامل خود در خانه یاد خواهید گرفت.
بنابراین، در این دوره چه چیزی را می خواهیم پوشش دهیم؟
با بیش از 30 مثال عملی، هنر قاببندی مسائل تجزیه و تحلیل دادهها را بهعنوان مشکلات Spark بیاموزید و به آنها مسلط شوید و سپس آنها را برای اجرای سرویسهای محاسبات ابری Databricks (سرویس رایگان) در این دوره اجرا کنید. خوب، دوره شامل موضوعاتی است که برای صدور گواهینامه گنجانده شده است:
1) اجزای معماری Spark
راننده،
Core/Slots/Threads،
مجری
پارتیشن ها
2) اجرای جرقه
شغل
وظایف
مراحل
3) مفاهیم جرقه
در حال ذخیره،
تغییرهای قاب داده در مقابل اقدامات، درهم ریختن
پارتیشن بندی، تغییر شکل گسترده در مقابل باریک
4) DataFrames API
DataFrameReader
DataFrameWriter
DataFrame [مجموعه داده]
5) ستون ردیف (DataFrame)
6) توابع Spark SQL
برای شروع دوره و برای انجام این کار، باید محیط خود را تنظیم کنید.
بنابراین، اولین چیزی که به آن نیاز دارید یک مرورگر وب است که می تواند (Google Chrome یا Firefox، یا Safari، یا Microsoft Edge (آخرین نسخه)) روی دسکتاپ Windows، Linux، و macOS باشد
این آموزش کاملاً عملی با محیط Databricks است.
مهندس Bigdata من معمار راه حل هستم با 12 سال تجربه در صنعت بانکداری ، ارتباطات از راه دور و خدمات مالی در طیف متنوعی از نقش ها در برنامه های کارت اعتباری ، پرداخت ها ، انبار داده و مرکز داده نقش من به عنوان Bigdata و Cloud Architect به عنوان بخشی از تیم Bigdata برای ارائه راه حل نرم افزاری کار می کنم. مسئولیت ها شامل - از همه مسائل مربوط به Hadoop پشتیبانی کنید - معیار سیستم های موجود ، تجزیه و تحلیل چالش های سیستم موجود/گلوگاه ها و پیشنهاد راه حل های مناسب برای از بین بردن آنها بر اساس فن آوری های مختلف Big Data - تجزیه و تحلیل و تعریف جوانب مثبت و منفی فناوری ها و سیستم عامل های مختلف - موارد استفاده ، راه حل ها و توصیه ها را تعریف کنید - استراتژی Big Data را تعریف کنید - انجام تجزیه و تحلیل دقیق از مشکلات کسب و کار و محیط های فنی - راه حل عملی بزرگ داده را بر اساس تجزیه و تحلیل نیازهای مشتری تعریف کنید - توصیه های عملی Big Big Cluster را تعریف کنید - به مشتریان در مورد فن آوری های مختلف Big Data آموزش دهید تا به آنها در درک نکات مثبت و منفی Big Data کمک کند - حاکمیت داده ها - ساخت ابزارهایی برای بهبود بهره وری توسعه دهنده و اجرای روشهای استاندارد
نمایش نظرات