آموزش شروع کاوش و تحلیل داده ها با Apache Spark

Beginning Data Exploration and Analysis with Apache Spark

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: 80٪ کار دانشمند داده تهیه داده است. این دوره همه چیز در مورد آماده سازی داده ها است ، یعنی تمیز کردن ، تبدیل ، جمع بندی داده ها با استفاده از Spark. همه را بزرگ کنید بررسی اجمالی دوره 1m 42s شروع کار با مجموعه داده های توزیع شده انعطاف پذیر Spark 27 متر 11 ثانیه تغییر شکل و تمیز کردن داده های بدون ساختار 32 متر 1 ثانیه جمع بندی داده ها در کنار ابعاد 30 متر 30 ساله روابط مدل سازی در جهان اجتماعی مارول 25 متر 59 علائم تجاری و نام تجاری اشخاص ثالث ذکر شده در این دوره متعلق به صاحبان مربوطه می باشند و Pluralsight وابسته یا تأیید شده توسط این احزاب نیست.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

شروع کار با مجموعه داده های توزیع شده انعطاف پذیر Spark Getting Started with Spark's Resilient Distributed Datasets

  • نقش جرقه در تجزیه و تحلیل داده ها The Role of Spark in Data Analysis

  • درک اجزای Spark Understanding the Components of Spark

  • نصب Spark Standalone در یک محیط محلی Installing Spark Standalone in a Local Environment

  • سلام به جهان: بارگیری یک مجموعه داده Hello World: Loading a Data Set

  • درک مجموعه داده های توزیع شده انعطاف پذیر Understanding Resilient Distributed Datasets

تغییر شکل و تمیز کردن داده های بدون ساختار Transforming and Cleaning Unstructured Data

  • تجزیه و تحلیل جنایت در شهر نیویورک Analyzing Crime in New York City

  • برنامه نویسی در پارادایم عملکردی Programming in the Functional Paradigm

  • استفاده از سازه های عملکردی برای تبدیل مجموعه داده ها Applying Functional Constructs to Transform Datasets

  • ردیف ها را فیلتر می کنید Filtering Rows

  • تبدیل پرونده ها برای استخراج فیلدها Transforming Records to Extract Fields

  • شناسایی و فیلتر کردن مقادیر از دست رفته Identifying and Filtering Missing Values

  • شناسایی و فیلتر کردن ناهنجاری ها Identifying and Filtering Anomalies

  • خلاصه و تجسم جرم در NYC Summarizing and Visualizing Crime in NYC

جمع بندی داده ها در کنار ابعاد Summarizing Data Along Dimensions

  • نمایندگی داده ها با استفاده از RDD های جفت Representing Data Using Pair RDDs

  • ایجاد RDD جفت Creating a Pair RDD

  • خلاصه RDD های جفت Summarizing Pair RDDs

  • محاسبه روند روزانه Computing a Daily Trend

  • ادغام RDD های جفت Merging Pair RDDs

  • افزودن ابعاد به RDD Adding a Dimension to an RDD

  • محاسبه میانگین ها با RDD های جفت Computing Averages with Pair RDDs

  • مقایسه میانگین های روزانه Comparing Daily Averages

روابط مدل سازی در جهان اجتماعی مارول Modeling Relationships in the Marvel Social Universe

  • نمایش مجموعه های داده به عنوان شبکه Representing Datasets as Networks

  • یافتن تأثیرگذارترین شخصیت ها Finding the Most Influential Characters

  • ایجاد یک شبکه همزمانی Building a Co-occurrence Network

  • یافتن مهمترین روابط Finding the Most Important Relationships

نمایش نظرات

آموزش شروع کاوش و تحلیل داده ها با Apache Spark
جزییات دوره
1h 57m
26
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
98
4.5 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Swetha Kolalapudi Swetha Kolalapudi

Swetha عاشق بازی با داده ها و خرد کردن اعداد است تا اطلاعات خوبی کسب کند. او فارغ التحصیل مدارس عالی مانند IIT Madras و IIM احمدآباد است. وی اولین عضو تیم Elite Analytics نخبه Flipkart بود و در مقیاس دهی بیش از 100 کارمند نقش مهمی داشت. سوئتا همیشه تمایل به کارآفرینی و علاقه به تدریس داشته است. او اکنون این شانس را دارد که به عنوان بنیانگذار Loonycorn ، یک استودیوی محتوا با هدف ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی ، همکاری کند. Loonycorn در حال کار بر روی ساخت موتور (ثبت اختراع ثبت شده) برای خودکار کردن انیمیشن ها برای ارائه و محتوای آموزشی است.