نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
این دوره به شما می آموزد که چگونه از Apache Spark برای تجزیه و تحلیل داده های بزرگ خود با سرعت سریع استفاده کنید. ترک هادوپ در غبار! برای یک غوطه وری عمیق در SQL و Streaming ، عاقبت را بررسی کنید ، مدیریت داده های سریع با Apache Spark SQL و جریان. دنیای همیشه متصل ما در حال ایجاد داده ها سریعتر از آن است که قانون مور بتواند ادامه دهد ، و این باعث می شود که ما در هوشمندانه تر باشیم تصمیم گیری در مورد چگونگی تجزیه و تحلیل آن. قبلاً ما چارچوب MapReduce Hadoop را برای پردازش دسته ای داشتیم ، اما تقاضای مدرن پردازش داده های بزرگ ، این چارچوب را پشت سر گذاشته است. همان جایی است که Apache Spark وارد عمل می شود ، با سرعت 10-100 برابر سریعتر از Hadoop و رکورد جهانی در مرتب سازی در مقیاس بزرگ ، به خود می بالد. انتزاع عمومی Spark به این معنی است که می تواند فراتر از پردازش دسته ای ساده گسترش یابد ، و آن را قادر به مواردی مانند الگوریتم های سریع ، تکراری و دقیقاً یک بار جریان معانی معنایی می کند. در این دوره ، شما Spark را از ابتدا یاد خواهید گرفت ، قبل از ایجاد یک برنامه تجزیه و تحلیل ویکی پدیا به عنوان یکی از ابزارهای یادگیری دامنه گسترده ای از API اصلی ، با تاریخچه آن شروع می کنید. این دانش اصلی ، جستجوی سایر کتابخانه های Spark مانند جریان و API های SQL را آسان تر می کند. سرانجام ، شما یاد خواهید گرفت که چگونه از چند لبه خشن Spark جلوگیری کنید. این دوره را با کمربند ابزاری که قادر به ایجاد برنامه Spark با حداکثر عملکرد خود است ، ترک خواهید کرد.
سرفصل ها و درس ها
شروع شدن
Getting Started
-
چرا جرقه؟
Why Spark?
-
انفجار Hadoop به یکپارچه سازی جرقه
Hadoop Explosion to Spark Unification
-
پیشینه جرقه
Spark's Background
-
نصب و راه اندازی
Installation
-
زبان های برنامه نویسی Spark
Spark Programming Languages
-
سلام به داده های بزرگ!
Hello Big Data!
-
لجستیک
Logistics
-
منابع
Resources
-
خلاصه
Summary
Spark Core: قسمت 1
Spark Core: Part 1
-
معرفی
Intro
-
جرقه زدن
Spark Appification
-
RDD چیست؟
What Is an RDD?
-
در حال بارگیری داده ها
Loading Data
-
لامبدا
Lambdas
-
تبدیل داده ها
Transforming Data
-
تحولات بیشتر
More Transformations
-
اقدامات و املاک مشارکتی
Actions and the Associative Property
-
اقدام به داده ها
Acting on Data
-
ماندگاری
Persistence
-
منابع
Resources
-
خلاصه
Summary
Spark Core: قسمت 2
Spark Core: Part 2
-
معرفی
Intro
-
تبدیل های ضمنی
Implicit Conversions
-
روشهای ارزش کلیدی
Key Value Methods
-
ذخیره اطلاعات
Caching Data
-
جمع آوری داده ها
Accumulating Data
-
جاوا در Spark
Java in Spark
-
منابع
Resources
-
خلاصه
Summary
توزیع و ابزار دقیق
Distribution and Instrumentation
-
معرفی
Intro
-
جرقه ارسال
Spark Submit
-
مدیریت خوشه
Cluster Management
-
اسکریپت های خوشه ای مستقل
Standalone Cluster Scripts
-
راه اندازی AWS
AWS Setup
-
جرقه در نخ در EMR
Spark on Yarn in EMR
-
Spark UI
Spark UI
-
منابع
Resources
-
خلاصه
Summary
جرقه کتابخانه ها
Spark Libraries
-
معرفی
Intro
-
Spark SQL
Spark SQL
-
Spark SQL نسخه ی نمایشی
Spark SQL Demo
-
Spark SQL Demo - سمت SQL
Spark SQL Demo - The SQL Side
-
جریان
Streaming
-
پخش آزمایشی
Streaming Demo
-
فراگیری ماشین
Machine Learning
-
نسخه ی نمایشی یادگیری ماشین
Machine Learning Demo
-
GraphX
GraphX
-
نسخه نمایشی GraphX
GraphX Demo
-
منابع
Resources
-
خلاصه
Summary
بهینه سازی ها و آینده
Optimizations and the Future
-
معرفی
Intro
-
تعطیلات
Closures
-
صدا و سیما
Broadcasting
-
بهینه سازی پارتیشن بندی
Optimizing Partitioning
-
آینده جرقه
Spark's Future
-
منابع
Resources
-
خلاصه
Summary
نمایش نظرات