لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش تجزیه و تحلیل پیش بینی با استفاده از Apache Spark MLlib در Databricks
Predictive Analytics Using Apache Spark MLlib on Databricks
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره به شما می آموزد که تکنیک های مهم برای تجزیه و تحلیل پیش بینی کننده مانند رگرسیون و طبقه بندی را با استفاده از Apache Spark MLlib در Databricks درک و پیاده سازی کنید. موتور تجزیه و تحلیل یکپارچه Spark یکی از محبوب ترین چارچوب ها برای تجزیه و تحلیل و پردازش کلان داده است. Spark APIهای بسیار جامع و آسان برای استفاده را برای یادگیری ماشین ارائه می دهد که می توانید از آنها برای ایجاد مدل های پیش بینی برای رگرسیون و طبقه بندی و داده های پیش پردازش برای تغذیه این مدل ها استفاده کنید. در این دوره آموزشی، تحلیل پیشگویانه با استفاده از Apache Spark MLlib در Databricks، پیاده سازی مدل های یادگیری ماشینی با استفاده از Spark ML APIs را خواهید آموخت. ابتدا، کتابخانههای مختلف Spark موجود برای یادگیری ماشین، کتابخانه قدیمیتر مبتنی بر RDD و کتابخانه جدیدتر مبتنی بر DataFrame را درک خواهید کرد. سپس دامنه ترانسفورماتورهای موجود در Spark را برای پیش پردازش داده ها برای یادگیری ماشین بررسی خواهید کرد - مانند ترانسفورماتورهای مقیاس بندی و استانداردسازی برای داده های عددی و رمزگذاری برچسب و ترانسفورماتورهای رمزگذاری یک داغ برای داده های طبقه بندی شده. در مرحله بعد، شما از مدل های رگرسیون خطی و مجموعه ای مانند جنگل های تصادفی و درختان تقویت شده با گرادیان برای ساخت مدل های رگرسیون استفاده خواهید کرد. شما از این مدل ها برای پیش بینی داده های دسته ای استفاده خواهید کرد. علاوه بر این، همچنین خواهید دید که چگونه می توانید از Spark ML Pipelines برای به هم پیوستن ترانسفورماتورها و برآوردگرها برای ایجاد یک گردش کار کامل یادگیری ماشین استفاده کنید. در نهایت، شما مدل های طبقه بندی را با استفاده از رگرسیون لجستیک و همچنین درخت های تصمیم پیاده سازی خواهید کرد. شما مدل ML را با استفاده از دادههای دستهای آموزش میدهید، اما پیشبینیهایی را در جریان دادهها انجام میدهید. همچنین از تنظیم هایپرپارامتر و اعتبارسنجی متقابل برای یافتن بهترین مدل برای داده های خود استفاده خواهید کرد. پس از اتمام این دوره، مهارت ها و دانش لازم برای ایجاد مدل های ML با Spark MLlib را خواهید داشت که برای انجام تجزیه و تحلیل پیش بینی با استفاده از یادگیری ماشین لازم است.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
شروع یادگیری ماشین با Apache Spark در Databricks
Getting Started with Machine Learning with Apache Spark on Databricks
بررسی نسخه
Version Check
پیش نیازها و رئوس مطالب دوره
Prerequisites and Course Outline
یادگیری ماشین در آپاچی اسپارک
Machine Learning on Apache Spark
نسخه ی نمایشی: پیکربندی فضای کاری و تنظیم یک نوت بوک
Demo: Configuring the Workspace and Setting up a Notebook
نسخه ی نمایشی: بررسی مجموعه داده های دیابت
Demo: Exploring the Diabetes Dataset
نسخه ی نمایشی: استانداردسازی و مقیاس بندی
Demo: Standardization and Scaling
نسخه ی نمایشی: عادی سازی
Demo: Normalization
نسخه ی نمایشی: تبدیل مقادیر پیوسته به ارزش های طبقه ای
Demo: Converting Continuous Values to Categorical Values
نسخه ی نمایشی: توکن کردن داده های متنی
Demo: Tokenizing Text Data
نسخه ی نمایشی: رمزگذاری برچسب و رمزگذاری تک داغ
Demo: Label Encoding and One-hot Encoding
نسخه ی نمایشی: انتخاب ویژگی
Demo: Feature Selection
انجام رگرسیون بر روی داده های دسته ای
Performing Regression on Batch Data
مروری سریع بر رگرسیون خطی
Quick Overview of Linear Regression
Lasso Ridge و رگرسیون خالص الاستیک
Lasso Ridge and Elastic Net Regression
نسخه ی نمایشی: بررسی مجموعه داده های امید به زندگی
Demo: Exploring the Life Expectancy Dataset
نسخه ی نمایشی: ساخت و ارزیابی یک مدل رگرسیون خطی
Demo: Building and Evaluating a Linear Regression Model
Pluralsight یکی از پرطرفدارترین پلتفرمهای آموزش آنلاین است که به میلیونها کاربر در سراسر جهان کمک میکند تا مهارتهای خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دورههای آموزشی در زمینههای فناوری اطلاعات، توسعه نرمافزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه میدهد.
یکی از ویژگیهای برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعهدهندگان و کارشناسان معتبر، دورههایی را ارائه میدهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژیها نگه میدارد. این امر به کاربران این اطمینان را میدهد که دورههایی که در Pluralsight میپذیرند، با جدیدترین دانشها و تجارب به روز شدهاند.
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات