لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش یادگیری ماشین مقیاسپذیر روی دادههای بزرگ (Big Data) با استفاده از Apache Spark
- آخرین آپدیت
دانلود Scalable Machine Learning on Big Data using Apache Spark
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره شما را با مهارتهای لازم برای مقیاسبندی وظایف علوم داده و یادگیری ماشین (ML) روی مجموعههای دادههای بزرگ با استفاده از Apache Spark آشنا میکند. اکثر پروژههای یادگیری ماشین در دنیای واقعی شامل مجموعههای داده بسیار بزرگی هستند که فراتر از محدودیتهای CPU، حافظه و فضای ذخیرهسازی یک کامپیوتر واحد میباشند.
آپاچی اسپارک (Apache Spark) یک فریمورک متنباز است که از محاسبات خوشهای (Cluster Computing) و ذخیرهسازی توزیعشده برای پردازش مجموعههای داده بسیار حجیم به روشی کارآمد و مقرونبهصرفه استفاده میکند. بنابراین، داشتن دانش کاربردی در کار با Apache Spark یک دارایی ارزشمند و یک تمایز بالقوه برای مهندسان یادگیری ماشین است.
پس از اتمام این دوره، شما قادر خواهید بود:
- درک عملی از Apache Spark به دست آورید و آن را برای حل مسائل یادگیری ماشین در هر دو مقیاس دادههای کوچک و بزرگ به کار ببرید.
- نحوه نوشتن کدهای موازی که قادر به اجرا روی هزاران CPU هستند را درک کنید.
- از خوشههای محاسباتی مقیاس بزرگ برای اعمال الگوریتمهای یادگیری ماشین روی پتابایتها داده با استفاده از SparkML Pipelines استفاده کنید.
- خطاهای کمبود حافظه (Out-of-Memory) را که در فریمورکهای سنتی یادگیری ماشین هنگام عدم گنجایش دادهها در حافظه اصلی رخ میدهد، حذف کنید.
- هزاران مدل مختلف ML را به صورت موازی تست کنید تا بهترین مدل را بیابید (تکنیکی که توسط بسیاری از برندگان مسابقات Kaggle استفاده میشود).
- (اختیاری) دستورات SQL را روی مجموعههای داده بسیار بزرگ با استفاده از Apache SparkSQL و API دیتافریمهای اسپارک اجرا کنید.
همین حالا ثبتنام کنید تا تکنیکهای یادگیری ماشین برای کار با Big Data را بیاموزید؛ تکنیکهایی که با موفقیت توسط شرکتهایی مانند علیبابا، اپل، آمازون، بایدو، eBay، IBM، ناسا، سامسونگ، SAP، تریپادوایزر، یاهو، زالاندو و بسیاری دیگر به کار گرفته شدهاند.
نکته: شما در طول این دوره، وظایف یادگیری ماشین را به صورت عملی روی یک خوشهی Apache Spark که توسط IBM به صورت رایگان ارائه شده است تمرین خواهید کرد و میتوانید پس از دوره نیز به استفاده از آن ادامه دهید.
پیشنیازها:
- برنامهنویسی مقدماتی پایتون
- مفاهیم پایه یادگیری ماشین (ویدئوهای مقدماتی اختیاری در این دوره ارائه شده است)
- مهارتهای پایه SQL برای محتوای اختیاری
دورههای زیر پیش از شروع این کلاس توصیه میشوند (مگر اینکه پیش از این مهارتهای لازم را کسب کرده باشید):
- پایتون برای علوم داده کاربردی یا مشابه آن
- یادگیری ماشین با پایتون یا مشابه آن
- SQL برای علوم داده برای بخشهای اختیاری
سرفصل ها و درس ها
هفته اول: مقدمه
Week 1: Introduction
مقدمهای بر Apache Spark برای یادگیری ماشین در دادههای بزرگ
Introduction to Apache Spark for Machine Learning on BigData
دادههای بزرگ (Big Data) چیست؟
What is Big Data?
راهکارهای ذخیرهسازی دادهها
Data storage solutions
استراتژیهای پردازش موازی دادهها در Apache Spark
Parallel data processing strategies of Apache Spark
نمایش نظرات