Beginning of dialog window. Escape will cancel and close the window.
End of dialog window.
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
این دوره چگونگی ساخت سیستم های داده بزرگ بزرگ ، مقیاس پذیر و در زمان واقعی را با استفاده از انواع API های Apache Spark ، از جمله API های Streaming ، DataFrame ، SQL و DataSources ، با Apache Kafka ، HDFS و Apache Cassandra ادغام می کند. این دوره با هدف فراتر از همه هیاهوی تبلیغات در دنیای داده های بزرگ و تمرکز بر آنچه واقعاً برای ساخت دسته های قوی و بسیار مقیاس پذیر سیستم های زمان واقعی کار می کند ، باشد. در این دوره ، با استفاده از معماری Lambda با استفاده از Spark ، Kafka و Cassandra ، فن آوری های مختلفی را به هم متصل خواهید کرد که به خوبی متناسب هستند و توسط برخی از شرکت ها با بیشترین نیاز به داده ها طراحی شده اند (مانند فیس بوک ، توییتر و LinkedIn) ) به شرکتهایی که در طراحی چارچوبهای پردازش داده پیشرو هستند مانند Apache Spark که در این دوره نقش اساسی دارد. شما به هر یک از اجزا جداگانه نگاه خواهید کرد و جزئیاتی در مورد معماری آنها خواهید ساخت که آنها را برای ساخت یک سیستم مبتنی بر معماری Lambda مناسب می کند. شما همچنان به ساخت یک برنامه کامل از ابتدا ادامه خواهید داد ، شروع با یک برنامه کوچک که شبیه سازی تولید داده در یک جریان است ، تا رسیدن به آدرس جهانی ، محاسبات غیر انجمنی ، به روزرسانی و راه اندازی مجدد برنامه و در نهایت ارائه واقعی نمایش زمان و دسته ای در کاساندرا. هنگامی که با این دوره به پایان رسید ، آماده خواهید بود تا با استفاده از این فن آوری ها زمین را بسازید و سیستم های داده بهتر از همیشه ایجاد کنید.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
یک معماری مدرن کلان داده
A Modern Big Data Architecture
تعریف معماری لامبدا
Defining the Lambda Architecture
چه چیزی می سازیم؟
What Are We Building?
تنظیم محیط شما: نسخه ی نمایشی
Setting up Your Environment: Demo
ابزارهایی که ما به آنها نیاز خواهیم داشت: نسخه ی نمایشی
Tools We'll Need: Demo
نصب Course VM: Demo
Installing the Course VM: Demo
پیگیری سریع به مقیاس: اصول
Fast Track to Scala: Basics
پیگیری سریع به مقیاس: ویژگی های زبان
Fast Track to Scala: Language Features
آهنگ سریع به مقیاس: مجموعه ها
Fast Track to Scala: Collections
جرقه با Zeppelin: Demo
Spark with Zeppelin: Demo
خلاصه
Summary
لایه دسته ای با Apache Spark
Batch Layer with Apache Spark
معرفی Spark
Introduction to Spark
اجزای جرقه و برنامه ریزی
Spark Components and Scheduling
شروع: نسخه ی نمایشی سازنده را وارد کنید
Getting Started: Log Producer Demo
اولین جرقه کار: نسخه ی نمایشی
First Spark Job: Demo
تجمع با RDD API: نسخه ی نمایشی
Aggregations with RDD API: Demo
تجمیع ها با DataFrame API: نسخه ی نمایشی
Aggregations with DataFrame API: Demo
ذخیره در HDFS و اجرای در YARN: نسخه ی نمایشی
Saving to HDFS and Executing on YARN: Demo
جستجوی داده ها با Spark DataSources API: نسخه ی نمایشی
Querying Data with Spark DataSources API: Demo
خلاصه
Summary
لایه لایه با جریان جرقه ای
Speed Layer with Spark Streaming
معرفی
Intro
اصول جریانی جرقه
Spark Streaming Fundamentals
DStream در مقابل RDD
DStream vs. RDD
با استفاده از transform و foreachRDD
Using transform and foreachRDD
SparkSQL در برنامه های جریانی
SparkSQL in Streaming Applications
مدل گیرنده جریانی
Streaming Receiver Model
ایجاد برنامه پخش جرقه ای: نسخه ی نمایشی
Creating Spark Streaming Application: Demo
تهیه کننده ورود جریان: در حال اجرا با Zeppelin: Demo
Streaming Log Producer: Running with Zeppelin: Demo
Refactoring برنامه جریان: نسخه ی نمایشی
Refactoring Streaming Application: Demo
جرقه زدن با تجمیع SparkSQL: نسخه ی نمایشی
Spark Streaming with SparkSQL Aggregations: Demo
پخش جریانی تجمعات با Zeppelin: Demo
Streaming Aggregations with Zeppelin: Demo
نمایش نظرات