آموزش Master Apache Spark (Scala) برای مهندسان داده

دانلود Master Apache Spark (Scala) for Data Engineers

در حال بارگزاری نمونه ویدیو، لطفا صبر کنید...
Video Player is loading.
Current Time 0:00
Duration 0:00
Loaded: 0%
Stream Type LIVE
Remaining Time 0:00
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles off, selected
      نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
      نمونه ویدیوها:
      • در حال بارگزاری، لطفا صبر کنید...
      توضیحات دوره: دوره شدید برای یادگیری Apache Spark با دست های زیادی برای برتری در دانشجویان مهندسی داده ، معماری Spark ، داخلی ، کار با RDDS ، کار با DataFrames ، با استفاده از IDE ، اجرای Spark را در خوشه EMR یاد می گیرد. پیش nیaزha: دانش اساسی زبان Scala.

      این دوره به گونه ای طراحی شده است تا اصول اولیه را به مفهوم پیشرفته بپردازد تا Apache Spark 3.x را به روش کارآمد و مختصر بیاموزد. این دوره برای مبتدیان و همچنین برای کسانی که از قبل Apache Spark را می شناسند مفید خواهد بود. این جزئیات عمیق در مورد داخلی Spark ، مجموعه داده ها ، برنامه اجرای ، Intellij IDE ، خوشه EMR با دست های زیادی را در بر می گیرد.

      این دوره برای مهندسین داده و معماران که مایل به طراحی و توسعه پروژه های مهندسی BigData با استفاده از Apache Spark هستند ، طراحی شده است. نیازی به دانش قبلی در مورد Apache Spark یا Hadoop ندارد. معماری Spark و مفاهیم اساسی در جزئیات توضیح داده شده است تا به شما در درک محتوای این دوره کمک کند. این دوره از زبان برنامه نویسی Scala استفاده می کند که بهترین زبان برای کار با Apache Spark است.

      این دوره پوشش می دهد:

      • معرفی اکوسیستم داده های بزرگ

      • داخلی را در جزئیات

        جرقه می زند
      • درک رانندگان جرقه ، مجریان.

      • درک برنامه اجرای در جزئیات

      • تنظیم محیط در Cloud محلی/Google

      • کار با Spark DataFrames

      • کار با Intellij IDE

      • در حال اجرا جرقه در خوشه EMR (AWS Cloud)

      • نمونه های پیشرفته DataFrame

      • کار با RDD

      • نمونه های RDD

      تا پایان این دوره ، شما قادر خواهید بود به هر سؤال مصاحبه جرقه ای پاسخ دهید و قادر خواهید بود کدی را اجرا کنید که در عرض چند دقیقه اطلاعات گیگای ارزش در Apache Spark را تجزیه و تحلیل می کند.







      سرفصل ها و درس ها

      معرفی کلان داده (اختیاری) Introduction to Big Data (Optional)

      • معرفی اطلاعات بزرگ Big Data Introduction

      • آشنایی با اکوسیستم کلان داده Understanding Big Data Ecosystem

      جرقه با نخ و HDFS Spark with Yarn & HDFS

      • Apache Spark چیست؟ What is Apache Spark

      • درک مدیر خوشه (نخ) Understanding Cluster Manager (Yarn)

      • درک ذخیره سازی توزیع شده (HDFS) Understanding Distributed Storage (HDFS)

      • نخ و HDFS Yarn & HDFS

      • اجرای Spark در Yarn/HDFS Running Spark on Yarn/HDFS

      • درک حالتهای استقرار Understanding Deploy Modes

      استفاده از Spark Shell Using Spark Shell

      • راه اندازی محلی Local Setup

      • Spark Shell در Local Spark Shell on Local

      • Spark-shell on Cluster Spark-shell on Cluster

      راه اندازی محلی Local Setup

      • راه اندازی محلی Local Setup

      داخلی Spark Spark Internals

      • رانندگان و مجریان Drivers & Executors

      • RDD ها و Dataframes RDDs & Dataframes

      • تحول و اقدامات Transformation & Actions

      • پوسته جرقه در محلی Spark Shell on Local

      • جرقه بر روی خوشه Spark-shell on Cluster

      • تحولات گسترده و باریک Wide & Narrow Transformations

      • درک برنامه اجرایی Understanding Execution Plan

      • برنامه های مختلف توسط راننده Different Plans by Driver

      Google Cloud Dataproc Cluster Google Cloud Dataproc Cluster

      • معرفی Intro

      • راه اندازی خوشه Cluster Setup

      • استفاده از Google Cloud Using Google Cloud

      • استفاده از HDFS Using HDFS

      کار با Dataframes Working with Dataframes

      • قاب داده از Json Dataframe from Json

      • قاب داده از CSV Dataframe from CSV

      • قاب داده از پارکت Dataframe from Parquet

      • قاب داده از Avro Dataframe from Avro

      • قاب داده از XML Dataframe from XML

      • کار با ستون ها Working with columns

      • کار با رشته ها Working with Strings

      • کار با خرما Working with Dates

      • API فیلتر داده Dataframe Filter API

      • SQUL SQL Spark SQL

      • کار با کندو Working with Hive

      استفاده از Intellij IDE Using Intellij IDE

      • راه اندازی Intellij Intellij Setup

      • راه اندازی پروژه Project Setup

      • نوشتن اولین برنامه جرقه در IDE Writing first Spark program on IDE

      • درک پیکربندی جرقه Understanding spark configuration

      • افزودن اقدامات/تحولات Adding Actions/Transformations

      • درک برنامه اجرایی Understanding Execution Plan

      قاب داده پیشرفته Advanced Dataframe

      • مجموعه داده ها در مقابل Dataframe Datasets versus Dataframe

      • توابع تعریف شده توسط کاربر (UDFS) User Defined Functions (UDFS)

      اجرای Spark در EMR (AWS Cloud) Running Spark on EMR (AWS Cloud)

      • مروری بر خوشه EMR EMR Cluster Overview

      • راه اندازی خوشه Cluster Setup

      • تنظیم Spark Code برای EMR Setting Spark Code for EMR

      • با استفاده از Spark-submit Using Spark-submit

      • اجرای Spark در EMR Cluster Running Spark on EMR Cluster

      کار با RDD ها Working with RDDs

      • تبدیل نقشه Map Transformation

      • به روز رسانی محیط Environment update

      • راه اندازی Cloudera vm Cloudera vm Setup

      • نقشه تخت FlatMap

      • فیلتر/تقاطع Filter/Intersection

      • اتحادیه/متمایز Union/Distinct

      • GroupByKey GroupByKey

      • ReduceByKey ReduceByKey

      • SortByKey SortByKey

      • map_partition map_partition

      • ادغام/تقسیم مجدد Colease/Repartition

      • می پیوندد Joins

      • اقدامات جرقه ای Spark Actions

      نمونه های RDD با Scala IDE RDD Examples with Scala IDE

      • درک مقیاس چندگانه Understanding scala tuples

      • فیلترهای گزارش خطاها Filter Error Logs

      • سفارشات توسط مشتریان Orders By Customers

      • جمعیت هر شهر Population of each city

      نمایش نظرات

      آموزش Master Apache Spark (Scala) برای مهندسان داده
      جزییات دوره
      4.5 hours
      61
      Udemy (یودمی) Udemy (یودمی)
      (آخرین آپدیت)
      10,451
      4.4 از 5
      دارد
      دارد
      دارد
      Navdeep Kaur
      جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

      Google Chrome Browser

      Internet Download Manager

      Pot Player

      Winrar

      Navdeep Kaur Navdeep Kaur

      TechnoAvengers.com (مerسس) من یک معمار داده بزرگ با 11 سال سابقه صنعت در فناوری ها و حوزه های مختلف هستم. من علاقه زیادی به ارائه آموزش در زمینه فناوری های جدید دارم. من گواهینامه توسعه دهنده CCA175 Hadoop and Spark و گواهینامه معمار راه حل AWS را دریافت کرده ام. من عاشق هدایت مردم و کمک به آنها برای رسیدن به اهداف جدید هستم.