جدید! برای Spark 3.0 به روز شد!
تجزیه و تحلیل «دادههای بزرگ» یک مهارت داغ و بسیار ارزشمند است – و این دوره به شما داغترین فناوری در کلان داده را آموزش میدهد: Apache Spark. کارفرمایان از جمله Amazon، EBay، NASA JPL و Yahoo همگی از Spark برای استخراج سریع معنی استفاده میکنند. از مجموعه دادههای انبوه در سراسر یک خوشه Hadoop مقاوم در برابر خطا. همان تکنیکها را با استفاده از سیستم ویندوز خود در خانه یاد خواهید گرفت. این آسانتر از آن چیزی است که فکر میکنید، و از یک مهندس سابق و مدیر ارشد خواهید آموخت. از Amazon و IMDb.
Spark هنگام استفاده از زبان برنامه نویسی Scala بهترین عملکرد را دارد، و این دوره شامل یک دوره آموزشی تصادفی در Scala است تا شما را سریعاً به سرعت افزایش دهد. با این حال، برای کسانی که با Python آشنایی بیشتری دارند، نسخه پایتون این کلاس نیز در دسترس است: "Taming Big Data with Apache Spark and Python - Hands On".
در بیش از 20 مثال عملی، هنر قاببندی مشکلات تجزیه و تحلیل دادهها را بهعنوان مشکلات Spark بیاموزید و به آن مسلط شوید و سپس آنها را برای اجرای سرویسهای رایانش ابری در این دوره، مقیاس دهید.
مفاهیم ذخیرهسازی دادههای توزیعشده انعطافپذیر Spark را بیاموزید
در زبان برنامه نویسی اسکالا یک دوره آموزشی خرابی دریافت کنید
کارهای Spark را به سرعت با استفاده از Scala توسعه و اجرا کنید
مسائل تحلیل پیچیده را به اسکریپت های Spark تکراری یا چند مرحله ای ترجمه کنید
با استفاده از سرویس Elastic MapReduce آمازون، مجموعه دادههای بزرگتر را افزایش دهید
بدانید که Hadoop YARN چگونه Spark را در میان خوشههای محاسباتی توزیع میکند
استفاده از سایر فناوریهای Spark، مانند Spark SQL، DataFrames، DataSets، Spark Streaming و GraphX را تمرین کنید
در پایان این دوره، کدی را اجرا میکنید که در عرض چند دقیقه، اطلاعات گیگابایت را در فضای ابری تجزیه و تحلیل میکند.
در طول راه کمی سرگرم خواهیم شد. با چند مثال ساده از استفاده از Spark برای تجزیه و تحلیل دادههای رتبهبندی فیلم و متن در یک کتاب، گرم میشوید. زمانی که اصول اولیه را در دست گرفتید، به سراغ کارهای پیچیده و جالب تر می رویم. ما از یک میلیون رتبهبندی فیلم برای یافتن فیلمهایی که شبیه یکدیگر هستند استفاده میکنیم، و حتی ممکن است در این فرآیند فیلمهای جدیدی را که ممکن است دوست داشته باشید کشف کنید! ما یک نمودار اجتماعی از ابرقهرمانان را تجزیه و تحلیل خواهیم کرد و خواهیم فهمید که "محبوب ترین" ابرقهرمان کیست - و سیستمی برای یافتن "درجات جدایی" بین ابرقهرمانان ایجاد می کنیم. آیا همه ابرقهرمانان مارول در چند درجه از اتصال به مرد عنکبوتی هستند؟ پاسخ را خواهید یافت.
این دوره بسیار کاربردی است. شما بیشتر وقت خود را صرف دنبال کردن با مربی خواهید کرد، زیرا ما با هم کد واقعی را می نویسیم، تجزیه و تحلیل می کنیم و اجرا می کنیم - هم در سیستم خود و هم در فضای ابری با استفاده از سرویس Elastic MapReduce آمازون. 7.5 ساعت محتوای ویدیویی گنجانده شده است، با بیش از 20 نمونه واقعی از افزایش پیچیدگی که میتوانید خودتان بسازید، اجرا کنید و مطالعه کنید. با سرعت خود و بر اساس برنامه زمانی خود از آنها عبور کنید. این دوره با مروری بر سایر فناوریهای مبتنی بر Spark، از جمله Spark SQL، Spark Streaming و GraphX به پایان میرسد.
اکنون ثبت نام کنید و از دوره لذت ببرید!
"من برای اولین بار Spark را با استفاده از دوره فرانک "Apache Spark 2 with Scala - Hands On with Big Data!" مطالعه کردم. این یک نقطه شروع عالی برای من بود، کسب دانش در Scala و مهمتر از همه نمونه های عملی از برنامه های Spark این به من درکی از تمام مفاهیم اصلی Spark مربوطه، RDD ها، مجموعه داده های فریم های داده، Spark Streaming، AWS EMR داد. در عرض چند ماه پس از اتمام، از دانش به دست آمده از این دوره استفاده کردم تا در شرکت فعلی خود به طور عمده روی کار کنم. برنامه های Spark. از آن زمان من به کار با Spark ادامه داده ام. من به شدت هر یک از دوره های Franks را توصیه می کنم زیرا او مفاهیم را به خوبی ساده می کند و روش تدریس او به راحتی قابل پیگیری و ادامه است! " - Joey Faherty
این کلاس پر از بسیاری از فعالیت های عملی جالب است که شامل تجزیه و تحلیل رتبه بندی فیلم ها و ارتباطات بین ابرقهرمانان می شود! اما در اینجا یک چالش دیگر وجود دارد که می توانید پس از اتمام دوره امتحان کنید:
یک اسکریپت Spark بنویسید که مجموعه دادههای یک میلیون رتبهبندی را از MovieLens که در این دوره استفاده کردیم، تجزیه و تحلیل میکند. بیایید بفهمیم بدترین فیلمی که تا به حال ساخته شده چه بوده است!
اما، ما نمیخواهیم فیلمی که فقط یک امتیاز دارد، که اتفاقاً یک ستاره است، "برنده" باشد. با تهیه فهرستی از فیلمها که بر اساس رتبهبندی متوسط مرتب شدهاند، شروع کنید، که سخت نیست - اما سپس آن فهرست را بر اساس تعداد رتبهبندیها مرتب کنید، به طوری که فیلمهایی که رتبه بد و همچنین تعداد زیادی رتبهبندی دارند، آنهایی باشند که نشان میدهند. اول بالا.
احتمالاً همچنان باید از تعداد زیادی نتایج جعلی 1 ستاره عبور کنید - پس در مرحله بعد، فیلتری را اجرا کنید که هر فیلمی را که مثلاً رتبهبندی کمتر از 10 دارند، حذف میکند. این باید فیلمهای مبهمی را که اطلاعات کافی برای آنها نداریم فیلتر کند. 10 یک قطع دلخواه است. ممکن است متوجه شوید که با آن شماره بازی می کنید.
شما همچنین با چالش تقسیم خروجی در هستههای مختلف که این دادهها را پردازش میکنند، مواجه خواهید بود. میتوانید برای دور زدن آن فقط از «محلی» به جای «محلی[*]» استفاده کنید، اما حتی بهتر است راهی برای ادغام نتایج با هم ابداع کنید - یا با یک اسکریپت یا با پیگیری یک جهانی. برنده" با یک متغیر پخش.
به نظر بدترین فیلم تاریخ چیست؟
اسکیلشر یک پلتفرم آموزشی آنلاین است که به میلیونها افراد در سراسر جهان امکان یادگیری مهارتهای جدید را فراهم میکند. این پلتفرم با ارائه دورههای متنوع در زمینههایی از جمله هنر و طراحی، فناوری، کسب و کار، و زندگی موفق، به کاربران خود این امکان را میدهد تا به صورت آنلاین به یادگیری بپردازند.
یکی از ویژگیهای منحصر به فرد سکیلشر، ارائه دورههای تدریس شده توسط صاحبان مهارتها و افراد موفق در زمینههای مختلف است. این امر باعث میشود که کاربران از تجربیات و دانش عملی افرادی که در حوزههای مورد نظرشان موفق عمل کردهاند، بهرهمند شوند و بهترین اطلاعات را برای بهبود مهارتهای خود دریافت کنند. به این ترتیب، سکیلشر نه تنها یک پلتفرم آموزشی است، بلکه یک جامعه آموزشی است که افراد را به اشتراک گذاری دانش و تجربیات تشویق میکند و به آنها کمک میکند تا در مسیر پیشرفت و موفقیت خود ادامه دهند.
یادگیری ماشین و داده های بزرگ، آمازون سابق
فرانک 9 سال را در آمازون و IMDb گذراند و فناوری را توسعه و مدیریت کرد که به طور خودکار توصیه های محصول و فیلم را به صدها میلیون مشتری ارائه می دهد. زمان. فرانک دارای 17 حق ثبت اختراع صادر شده در زمینه های محاسبات توزیع شده ، داده کاوی و یادگیری ماشین است. در سال 2012، فرانک شرکت موفق خود را به نام Sundog Software راه اندازی کرد که بر فناوری محیط واقعیت مجازی تمرکز دارد و به دیگران در مورد تجزیه و تحلیل داده های بزرگ آموزش می دهد.
نمایش نظرات