لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش ساخت مدل های یادگیری ماشین در Spark 2
Building Machine Learning Models in Spark 2
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
آموزش مدلهای ML یک عملیات محاسباتی فشرده است و بهتر است در یک محیط توزیع شده انجام شود. این دوره به شما می آموزد که چگونه Spark می تواند به طور کارآمد کاوش داده ها، تمیز کردن، جمع آوری و آموزش مدل های ML را روی یک پلت فرم انجام دهد. Spark احتمالاً محبوب ترین موتور برای پردازش کلان داده این روزها است. در این دوره آموزشی، ساخت مدلهای یادگیری ماشین در Spark 2، ساخت و آموزش مدلهای یادگیری ماشین (ML) مانند رگرسیون، طبقهبندی، خوشهبندی و سیستمهای توصیه در محیط پردازش توزیع شده Spark 2.x را خواهید آموخت. این دوره با معرفی 2 کتابخانه ML موجود در Spark 2 شروع می شود. کتابخانه قدیمی spark.mllib که بر روی RDD ها ساخته شده است و کتابخانه جدیدتر spark.ml که بر روی دیتافریم ها ساخته شده است. شما این دو را در مقایسه خواهید دید تا به شما کمک کند بدانید چه زمانی باید یکی را بر دیگری انتخاب کنید. یک مدل طبقه بندی را خواهید دید که با استفاده از Decision Trees به روش قدیمی ساخته شده است، و خواهید دید که چگونه می توانید همان مدل را در کتابخانه جدیدتر spark.ml پیاده سازی کنید. این دوره بسیاری از ویژگی های Spark 2 را پوشش می دهد، از جمله مرور یک ویژگی کاملاً جدید در Spark 2، خطوط لوله ML که برای زنجیره تبدیل داده ها و عملیات ML استفاده می شود. در پایان این دوره با استفاده از ویژگی های پیشرفته ای که Spark 2 برای یادگیری ماشین ارائه می دهد، راحت خواهید بود. شما یاد خواهید گرفت که از اجزایی مانند ترانسفورماتورها، برآوردگرها و پارامترها در خطوط لوله ML خود برای کار با آموزش توزیع شده در مقیاس استفاده کنید.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
بسته های یادگیری ماشین: spark.mllib در مقابل spark.ml
Machine Learning Packages: spark.mllib vs. spark.ml
بررسی نسخه
Version Check
نمای کلی ماژول
Module Overview
پیش نیازها و بررسی اجمالی دوره
Prerequisites and Course Overview
RDDs: The Building Blocks of Spark
RDDs: The Building Blocks of Spark
DataFrames در Spark 2
DataFrames in Spark 2
نسخه ی نمایشی: Spark 2 نصب و کار با نوت بوک های Jupyter
Demo: Spark 2 Installation and Working with Jupyter Notebooks
spark.mllib در مقابل spark.ml
spark.mllib vs. spark.ml
معرفی درختان تصمیم
Introducing Decision Trees
ناخالصی جینی و جوانب مثبت و منفی درختان تصمیم
Gini Impurity and Pros and Cons of Decision Trees
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات