آموزش مبانی Apache Spark

Apache Spark Fundamentals

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: این دوره به شما می آموزد که چگونه از Apache Spark برای تجزیه و تحلیل داده های بزرگ خود با سرعت سریع استفاده کنید. ترک هادوپ در غبار! برای یک غوطه وری عمیق در SQL و Streaming ، عاقبت را بررسی کنید ، مدیریت داده های سریع با Apache Spark SQL و جریان. دنیای همیشه متصل ما در حال ایجاد داده ها سریعتر از آن است که قانون مور بتواند ادامه دهد ، و این باعث می شود که ما در هوشمندانه تر باشیم تصمیم گیری در مورد چگونگی تجزیه و تحلیل آن. قبلاً ما چارچوب MapReduce Hadoop را برای پردازش دسته ای داشتیم ، اما تقاضای مدرن پردازش داده های بزرگ ، این چارچوب را پشت سر گذاشته است. همان جایی است که Apache Spark وارد عمل می شود ، با سرعت 10-100 برابر سریعتر از Hadoop و رکورد جهانی در مرتب سازی در مقیاس بزرگ ، به خود می بالد. انتزاع عمومی Spark به این معنی است که می تواند فراتر از پردازش دسته ای ساده گسترش یابد ، و آن را قادر به مواردی مانند الگوریتم های سریع ، تکراری و دقیقاً یک بار جریان معانی معنایی می کند. در این دوره ، شما Spark را از ابتدا یاد خواهید گرفت ، قبل از ایجاد یک برنامه تجزیه و تحلیل ویکی پدیا به عنوان یکی از ابزارهای یادگیری دامنه گسترده ای از API اصلی ، با تاریخچه آن شروع می کنید. این دانش اصلی ، جستجوی سایر کتابخانه های Spark مانند جریان و API های SQL را آسان تر می کند. سرانجام ، شما یاد خواهید گرفت که چگونه از چند لبه خشن Spark جلوگیری کنید. این دوره را با کمربند ابزاری که قادر به ایجاد برنامه Spark با حداکثر عملکرد خود است ، ترک خواهید کرد.

سرفصل ها و درس ها

شروع شدن Getting Started

  • چرا جرقه؟ Why Spark?

  • انفجار Hadoop به یکپارچه سازی جرقه Hadoop Explosion to Spark Unification

  • پیشینه جرقه Spark's Background

  • نصب و راه اندازی Installation

  • زبان های برنامه نویسی Spark Spark Programming Languages

  • سلام به داده های بزرگ! Hello Big Data!

  • لجستیک Logistics

  • منابع Resources

  • خلاصه Summary

Spark Core: قسمت 1 Spark Core: Part 1

  • معرفی Intro

  • جرقه زدن Spark Appification

  • RDD چیست؟ What Is an RDD?

  • در حال بارگیری داده ها Loading Data

  • لامبدا Lambdas

  • تبدیل داده ها Transforming Data

  • تحولات بیشتر More Transformations

  • اقدامات و املاک مشارکتی Actions and the Associative Property

  • اقدام به داده ها Acting on Data

  • ماندگاری Persistence

  • منابع Resources

  • خلاصه Summary

Spark Core: قسمت 2 Spark Core: Part 2

  • معرفی Intro

  • تبدیل های ضمنی Implicit Conversions

  • روشهای ارزش کلیدی Key Value Methods

  • ذخیره اطلاعات Caching Data

  • جمع آوری داده ها Accumulating Data

  • جاوا در Spark Java in Spark

  • منابع Resources

  • خلاصه Summary

توزیع و ابزار دقیق Distribution and Instrumentation

  • معرفی Intro

  • جرقه ارسال Spark Submit

  • مدیریت خوشه Cluster Management

  • اسکریپت های خوشه ای مستقل Standalone Cluster Scripts

  • راه اندازی AWS AWS Setup

  • جرقه در نخ در EMR Spark on Yarn in EMR

  • Spark UI Spark UI

  • منابع Resources

  • خلاصه Summary

جرقه کتابخانه ها Spark Libraries

  • معرفی Intro

  • Spark SQL Spark SQL

  • Spark SQL نسخه ی نمایشی Spark SQL Demo

  • Spark SQL Demo - سمت SQL Spark SQL Demo - The SQL Side

  • جریان Streaming

  • پخش آزمایشی Streaming Demo

  • فراگیری ماشین Machine Learning

  • نسخه ی نمایشی یادگیری ماشین Machine Learning Demo

  • GraphX GraphX

  • نسخه نمایشی GraphX GraphX Demo

  • منابع Resources

  • خلاصه Summary

بهینه سازی ها و آینده Optimizations and the Future

  • معرفی Intro

  • تعطیلات Closures

  • صدا و سیما Broadcasting

  • بهینه سازی پارتیشن بندی Optimizing Partitioning

  • آینده جرقه Spark's Future

  • منابع Resources

  • خلاصه Summary

نمایش نظرات

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.

آموزش مبانی Apache Spark
جزییات دوره
4h 15m
57
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
300
3.9 از 5
دارد
دارد
دارد
Justin Pihony
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Justin Pihony Justin Pihony

جاستین یک مسافر نرم افزار است ، که به طور مداوم مهارت های خود را یاد می گیرد و عالی می کند. بیشتر اوایل کار حرفه ای او در C # و MSSQL بود ، اما او عاشق یادگیری زبانهای مختلف ، به ویژه Scala است. این علاقه به اسکالا باعث شد تا او به تیم لایتبند (Typesafe سابق) بپیوندد و حتی بیشتر در عمق کره زمین اسکالا فرو رود. و همانطور که دوست دارد یاد بگیرد ، دوست دارد دانش خود را از طریق آموزش و کمک به دیگران گسترش دهد. او یک پاسخ دهنده بسیار فعال در StackOverflow است و هم جلسات پیتزبورگ اسکالا و نهار ناهار خوری پیتسبورگ را برگزار می کند (یک جلسه ناهار نیمه منظم با محوریت فروشگاه گفتگو).