با چارچوب محاسباتی موازی شگفت انگیز Apache Spark شروع کنید - این دوره به ویژه برای توسعه دهندگان جاوا طراحی شده است.
اگر در علم داده تازه کار هستید و می خواهید بدانید که چگونه مجموعه داده های عظیم به صورت موازی پردازش می شوند، Java API برای spark یک راه عالی برای شروع سریع است.
همه اصولی که برای درک عملیات اصلی که میتوانید در Spark Core، SparkSQL و DataFrames انجام دهید به آن نیاز دارید، با مثالهایی که به راحتی قابل دنبال کردن هستند، به تفصیل پوشش داده شدهاند. میتوانید تمام مثالها را دنبال کنید و آنها را روی رایانه توسعه محلی خودتان اجرا کنید.
همراه با این دوره، ماژولی است که SparkML را پوشش میدهد، افزودنی هیجانانگیز به Spark که به شما امکان میدهد مدلهای یادگیری ماشینی را در دادههای بزرگ خود اعمال کنید! هیچ تجربه ریاضی لازم نیست!
و در نهایت، یک ماژول کامل 3 ساعته وجود دارد که Spark Streaming را پوشش میدهد، که در آن تجربه عملی از ادغام Spark با آپاچی کافکا برای مدیریت جریانهای کلان داده در زمان واقعی را خواهید داشت. ما از هر دو DStream و Structured Streaming API استفاده می کنیم.
به صورت اختیاری، اگر یک حساب AWS دارید، خواهید دید که چگونه کار خود را در یک خوشه سخت افزاری زنده EMR (Elastic Map Reduce) مستقر کنید. اگر با AWS آشنایی ندارید، میتوانید این ویدیو را نادیده بگیرید، اما همچنان ارزش تماشای آن را به جای دنبال کردن برنامهنویسی دارد.
شما عمیقاً به درونیات Spark خواهید رفت و خواهید فهمید که چگونه برنامه های اجرایی شما را بهینه می کند. ما عملکرد RDD ها را با SparkSQL مقایسه خواهیم کرد و شما در مورد مشکلات اصلی عملکرد که می تواند در هزینه های زیادی برای پروژه های زنده صرفه جویی کند، یاد خواهید گرفت.
در طول دوره، تمرینات بسیار خوبی را با جاوا لامبداس خواهید داشت - اگر تازه کار هستید، یک راه عالی برای یادگیری جاوا به سبک عملکردی.
مدرس دوره در برنامه نویسان جفت مجازی
Richard Chesterwoodتوسعه دهنده نرم افزار در VirtualPairProgrammers
Virtual Pair Programmers
نمایش نظرات