لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آپاچی اسپارک با جاوا - Spark را از یک استاد بزرگ داده بیاموزید [ویدئو]
Apache Spark with Java - Learn Spark from a Big Data Guru [Video]
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره آموزشی تمام اصول Apache Spark با جاوا را پوشش می دهد و هر آنچه را که باید در مورد توسعه برنامه های Spark با جاوا بدانید را به شما آموزش می دهد. در پایان این دوره، دانش عمیق pf Apache Spark، تجزیه و تحلیل کلی داده های بزرگ و مهارت های دستکاری را به دست خواهید آورد. با این مهارتهای جدید، میتوانید به شرکت خود کمک کنید تا Apache Spark را برای ایجاد خط لوله پردازش دادههای بزرگ و برنامههای کاربردی تجزیه و تحلیل داده تطبیق دهد. این دوره بیش از 10 نمونه داده های بزرگ را پوشش می دهد. شما دانش ارزشمندی در مورد نحوه قالب بندی مسائل تجزیه و تحلیل داده ها به عنوان مسائل Spark خواهید آموخت. با هم نمونه هایی مانند جمع آوری لاگ های وب آپاچی ناسا از منابع مختلف را یاد خواهیم گرفت. ما روند قیمت را با نگاهی به داده های املاک در کالیفرنیا بررسی خواهیم کرد. ما برنامههای Spark را مینویسیم تا از طریق دادههای نظرسنجی Stack Overflow، میانگین دستمزد توسعهدهندگان در کشورهای مختلف را بفهمیم. ما سیستمی را برای تجزیه و تحلیل نحوه توزیع فضاهای سازنده در مناطق مختلف بریتانیا و موارد دیگر توسعه خواهیم داد. - مروری بر معماری آپاچی اسپارک.
- با انتزاع اولیه Apache Spark، مجموعه داده های توزیع شده انعطاف پذیر (RDDs) کار کنید.
پردازش و تجزیه و تحلیل مجموعه داده های بزرگ
- برنامه های Apache Spark 2.0 را با استفاده از تبدیل ها و اقدامات RDD و Spark SQL توسعه دهید.
- برنامه های Spark را در یک خوشه Hadoop YARN از طریق سرویس Elastic MapReduce آمازون افزایش دهید.
- داده های ساختاریافته و نیمه ساختار یافته را با استفاده از Datasets و DataFrames تجزیه و تحلیل کنید و درک کاملی از Spark SQL ایجاد کنید.
- اطلاعات را در میان گره های مختلف در یک خوشه اسپارک آپاچی توسط متغیرهای پخش و انباشته ها به اشتراک بگذارید.
-یادگیری تکنیک های پیشرفته برای بهینه سازی و تنظیم کارهای Apache Spark با پارتیشن بندی، کش کردن و تداوم RDD ها.
- بهترین شیوه های کار با آپاچی اسپارک را در این زمینه بیاموزید. هر کسی که می خواهد به طور کامل نحوه عملکرد فناوری Apache Spark را درک کند و یاد بگیرد که چگونه Apache Spark در این زمینه استفاده می شود. مهندسان نرم افزاری که می خواهند برنامه های Apache Spark 2.0 را با استفاده از Spark Core و Spark SQL توسعه دهند. دانشمندان داده یا مهندسان داده که میخواهند با بهبود مهارتهای پردازش دادههای بزرگ، شغل خود را ارتقا دهند. - دانش عمیقی از Spark، تجزیه و تحلیل کلی داده های بزرگ و مهارت های دستکاری داده ها به دست خواهید آورد. * - شما می توانید برنامه Spark را توسعه دهید که با استفاده از سرویس Elastic MapReduce آمازون، گیگابایت داده را هم بر روی لپ تاپ و هم در فضای ابری تجزیه و تحلیل می کند.
سرفصل ها و درس ها
با آپاچی اسپارک شروع کنید
Get Started with Apache Spark
بررسی اجمالی دوره
The Course Overview
مقدمه ای بر اسپارک
Introduction to Spark
جاوا و گیت را نصب کنید
Install Java and Git
پروژه Spark را با IntelliJ IDEA راه اندازی کنید
Set up Spark project with IntelliJ IDEA
پروژه Spark را با Eclipse راه اندازی کنید
Set up Spark project with Eclipse
اولین کار Spark ما را اجرا کنید
Run our first Spark job
RDD
RDD
مبانی RDD
RDD Basics
RDD ها را ایجاد کنید
Create RDDs
تبدیل نقشه و فیلتر
Map and Filter Transformation
راه حل مسئله فرودگاه ها بر اساس عرض جغرافیایی
Solution to Airports by Latitude Problem
تبدیل FlatMap
FlatMap Transformation
تنظیم عملیات
Set Operation
اقدامات
Actions
حل مسئله جمع اعداد
Solution to Sum of Numbers Problem
جنبه های مهم در مورد RDD
Important Aspects about RDD
خلاصه ای از عملیات RDD
Summary of RDD Operations
ذخیره سازی و ماندگاری
Caching and Persistence
معماری اسپارک و اجزای سازنده
Spark Architecture and Components
معماری جرقه
Spark Architecture
اجزای جرقه
Spark Components
RDD را جفت کنید
Pair RDD
مقدمه ای بر جفت RDD
Introduction to Pair RDD
ایجاد جفت RDD
Create Pair RDDs
تبدیلهای فیلتر و MapValue در جفت RDD
Filter and MapValue Transformations on Pair RDD
کاهش با تجمع کلید
Reduce By Key Aggregation
نمونه راه حل برای مشکل خانه متوسط
Sample solution for the Average House problem
گروه بر اساس تبدیل کلید
Group by Key Transformation
مرتب سازی بر اساس تبدیل کلید
Sort by Key Transformation
نمونه راه حل برای مسئله شمارش کلمات مرتب شده
Sample Solution for the Sorted Word Count Problem
پارتیشن بندی داده ها
Data Partitioning
به عملیات بپیوندید
Join Operations
موضوع جرقه پیشرفته
Advanced Spark Topic
آکومولاتورها
Accumulators
راه حل مشکل پیگیری StackOverflow Survey
Solution to StackOverflow Survey Follow-up Problem
متغیرهای پخش
Broadcast Variables
Spark SQL
Spark SQL
مقدمه ای بر Spark SQL
Introduction to Spark SQL
Spark SQL در عمل
Spark SQL in Action
عمل Spark SQL: مشکل قیمت خانه
Spark SQL practice: House Price Problem
Spark SQL Joins
Spark SQL Joins
مجموعه داده با تایپ قوی
Strongly Typed Dataset
از Dataset یا RDD استفاده کنید
Use Dataset or RDD
تبدیل مجموعه داده و RDD
Dataset and RDD Conversion
تنظیم عملکرد Spark SQL
Performance Tuning of Spark SQL
در حال اجرا جرقه در یک خوشه
Running Spark in a Cluster
مقدمه ای بر Running Spark in a Cluster
Introduction to Running Spark in a Cluster
Package Spark Application and Use Spark-submit
Package Spark Application and Use spark-submit
برنامه Spark را در خوشه آمازون EMR (Elastic MapReduce) اجرا کنید
Run Spark Application on Amazon EMR (Elastic MapReduce) cluster
نمایش نظرات