دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش Master Big Data - Apache Spark/Hadoop/Sqoop/Hive/Flume/Mongo

Master Big Data - Apache Spark/Hadoop/Sqoop/Hive/Flume/Mongo

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: دوره آموزشی عمیق در Big Data - Apache Spark، Hadoop، Sqoop، Flume & Apache Hive، MongoDB و Big Data Cluster راه اندازی سیستم فایل و دستورات توزیع شده Hadoop. چرخه حیات فرمان sqoop. دستور import Sqoop برای انتقال داده ها از Mysql به HDFS. دستور Sqoop import برای انتقال داده ها از Mysql به Hive. کار با فرمت‌های مختلف فایل، فشرده‌سازی، جداکننده فایل، بند و پرس‌وجو هنگام وارد کردن داده‌ها. پرس و جوهای تقسیم شده و مرزی را درک کنید. از حالت افزایشی برای انتقال داده ها از Mysql به HDFS استفاده کنید. با استفاده از sqoop export، داده ها را از HDFS به Mysql منتقل کنید. با استفاده از sqoop export، داده ها را از Hive به Mysql منتقل کنید. معماری فلوم را درک کنید. با استفاده از flume، داده‌ها را از توییتر دریافت کرده و در HDFS ذخیره کنید. با استفاده از flume، داده ها را از netcat دریافت کرده و در HDFS ذخیره کنید. با استفاده از flume، داده‌ها را از exec دریافت کنید و روی کنسول نشان دهید. رهگیرهای فلوم. پیش نیازها: خیر

در این دوره، شما با یادگیری سیستم فایل توزیع شده هادوپ و رایج ترین دستورات هادوپ مورد نیاز برای کار با سیستم فایل Hadoop شروع خواهید کرد.

سپس با Sqoop Import

آشنا می شوید

چرخه حیات فرمان sqoop را درک کنید.
از دستور sqoop import برای انتقال داده ها از Mysql به HDFS استفاده کنید.
از دستور sqoop import برای انتقال داده ها از Mysql به Hive استفاده کنید.
از فرمت‌های مختلف فایل، فشرده‌سازی‌ها، جداکننده فایل، بند و پرس‌وجو در هنگام وارد کردن داده‌ها استفاده کنید.
پرسمان‌های تقسیم‌بندی و مرزی را درک کنید.
از حالت افزایشی برای انتقال داده ها از Mysql به HDFS استفاده کنید.

به‌علاوه، Sqoop Export را برای انتقال داده‌ها یاد خواهید گرفت.

صادرات sqoop چیست
با استفاده از sqoop export، داده ها را از HDFS به Mysql منتقل کنید.
با استفاده از sqoop export، داده ها را از Hive به Mysql منتقل کنید.

بعلاوه، با Apache Flume

آشنا خواهید شد

معماری فلوم را درک کنید.
با استفاده از flume، داده‌ها را از Twitter دریافت کرده و در HDFS ذخیره کنید.
با استفاده از flume، داده‌ها را از netcat دریافت کرده و در HDFS ذخیره کنید.
با استفاده از flume، داده‌ها را از exec دریافت کنید و در کنسول نمایش دهید.
فلوم رهگیرها را توصیف کنید و نمونه هایی از استفاده از رهگیرها را ببینید.
چندین عامل را فلوم کنید
تجمیع فلوم.

در بخش بعدی، با Apache Hive

آشنا خواهیم شد

Hive Intro
جدول مدیریت شده خارجی
کار با فایل های مختلف - Parket,Avro
فشرده‌سازی‌ها
تجزیه و تحلیل کندو
توابع رشته Hive
توابع تاریخ کندو
پارتیشن بندی
سطوبندی

درباره Apache Spark

خواهید آموخت

معرفی Spark
نمای کلی خوشه
RDD
DAG/Stages/Tasks
تغییر اقدامات
نمونه‌های اقدام تغییر شکل
فریم های داده Spark
قاب‌های داده Spark - کار با فشرده‌سازی فرمت‌های فایل متفاوت
APIهای Dataframes
Spark SQL
نمونه‌های چارچوب داده
Spark with Cassandra Integration
اجرای Spark در Intellij IDE
اجرای Spark در EMR

سرفصل ها و درس ها

معرفی کلان داده Big Data Introduction

معرفی دوره Course Intro
معرفی کلان داده Big Data Intro
درک اکوسیستم کلان داده Understanding Big Data Ecosystem

راه اندازی محیط Environment Setup

اصلاحات کلاستر GCP GCP Cluster Fixes
راه اندازی کلاستر در Google Cloud Cluster Setup on Google Cloud
به روز رسانی محیط زیست Environment Update

هادوپ و نخ Hadoop & Yarn

دستورات HDFS و Hadoop HDFS and Hadoop Commands
بررسی اجمالی خوشه نخ Yarn Cluster Overview

Sqoop Import Sqoop Import

Sqoop مقدمه Sqoop Introduction
مدیریت فهرست های هدف Managing Target Directories
کار با فرمت فایل پارکت Working with Parquet File Format
کار با فرمت فایل Avro Working with Avro File Format
کار با فشرده سازی های مختلف Working with Different Compressions
واردات مشروط Conditional Imports
پرس و جوهای تقسیم شده و مرزی Split-by and Boundary Queries
جداکننده های میدان Field delimeters
ضمائم افزایشی Incremental Appends
Sqoop-Hive Cluster Fix Sqoop-Hive Cluster Fix
واردات کندو Sqoop Sqoop Hive Import
Sqoop List جداول/پایگاه داده Sqoop List Tables/Database
Sqoop Assignment1 Sqoop Assignment1
Sqoop Assignment2 Sqoop Assignment2
Sqoop Import Practice1 Sqoop Import Practice1
Sqoop Import Practice2 Sqoop Import Practice2

Sqoop Export Sqoop Export

صادرات از Hdfs به Mysql Export from Hdfs to Mysql
صادرات از Hive به Mysql Export from Hive to Mysql
Avro فشرده شده را به Mysql صادر کنید Export Avro Compressed to Mysql
سخنرانی جایزه: Sqoop with Airflow Bonus Lecture: Sqoop with Airflow

آپاچی فلوم Apache Flume

معرفی فلوم و معماری Flume Introduction & Architecture
Exec Source و Logger Sink Exec Source and Logger Sink
انتقال داده ها از توییتر به HDFS Moving data from Twitter to HDFS
انتقال داده ها از NetCat به HDFS Moving data from NetCat to HDFS
رهگیرهای فلوم Flume Interceptors
مثال Flume Interceptor Flume Interceptor Example
فلوم چند عامل جریان Flume Multi-Agent Flow
تثبیت فلوم Flume Consolidation

Apache Hive Apache Hive

معرفی کندو Hive Introduction
پایگاه داده Hive Hive Database
جداول مدیریت شده Hive Hive Managed Tables
جداول خارجی کندو Hive External Tables
درج کندو Hive Inserts
Hive Analytics Hive Analytics
کار با پارکت Working with Parquet
فشرده سازی پارکت Compressing Parquet
کار با فرمت فایل ثابت Working with Fixed File Format
تغییر فرمان Alter Command
توابع رشته کندو Hive String Functions
توابع تاریخ کندو Hive Date Functions
پارتیشن بندی کندو Hive Partitioning
سطل سازی کندو Hive Bucketing

جرقه با نخ و HDFS Spark with Yarn & HDFS

آپاچی اسپارک چیست؟ What is Apache Spark
درک مدیر خوشه (نخ) Understanding Cluster Manager (Yarn)
آشنایی با فضای ذخیره سازی توزیع شده (HDFS) Understanding Distributed Storage (HDFS)
Running Spark در Yarn/HDFS Running Spark on Yarn/HDFS
آشنایی با Deploy Modes Understanding Deploy Modes

خوشه GCS GCS Cluster

جرقه در GCS Cluster Spark on GCS Cluster

لوازم داخلی اسپارک Spark Internals

رانندگان و مجریان Drivers & Executors
RDDs و Dataframes RDDs & Dataframes
تحول و اقدامات Transformation & Actions
تحولات گسترده و باریک Wide & Narrow Transformations
درک برنامه اجرایی Understanding Execution Plan
طرح های مختلف توسط راننده Different Plans by Driver

Spark RDD: Transformation & Actions Spark RDD : Transformation & Actions

تبدیل نقشه/نقشه مسطح Map/FlatMap Transformation
فیلتر/تقاطع Filter/Intersection
اتحاد/تحول متمایز Union/Distinct Transformation
GroupByKey/افراد را بر اساس ماه های تولد گروه بندی کنید GroupByKey/ Group people based on Birthday months
ReduceByKey/تعداد کل دانش آموزان در هر موضوع ReduceByKey / Total Number of students in each Subject
SortByKey/مرتب سازی دانش آموزان بر اساس rollno آنها SortByKey / Sort students based on their rollno
MapPartition/MapPartitionWithIndex MapPartition / MapPartitionWithIndex
تغییر تعداد پارتیشن ها Change number of Partitions
پیوستن/پیوستن به آدرس ایمیل بر اساس نام مشتری Join / join email address based on customer name
اقدامات جرقه Spark Actions

Spark RDD Practice Spark RDD Practice

اسکالا تاپلز Scala Tuples
گزارش های خطای فیلتر Filter Error Logs
فراوانی کلمه در فایل متنی Frequency of word in Text File
جمعیت هر شهر Population of each city
سفارشات ارسال شده توسط مشتریان Orders placed by Customers
میانگین امتیاز فیلم average rating of movie

Spark Dataframes و Spark SQL Spark Dataframes & Spark SQL

معرفی چارچوب داده Dataframe Intro
Dafaframe از Json Files Dafaframe from Json Files
دیتافریم از فایل های پارکت Dataframe from Parquet Files
دیتافریم از فایل های CSV Dataframe from CSV Files
دیتافریم از Avro File Dataframe from Avro File
کار با XML Working with XML
کار با ستون ها Working with Columns
کار با String Working with String
کار با خرما Working with Dates
API فیلتر Dataframe Dataframe Filter API
DataFrame API Part1 DataFrame API Part1
DataFrame API Part2 DataFrame API Part2
Spark SQL Spark SQL
کار با Hive Tables در Spark Working with Hive Tables in Spark
مجموعه داده ها در مقابل Dataframe Datasets versus Dataframe
توابع تعریف شده توسط کاربر (UDFS) User Defined Functions (UDFS)

استفاده از Intellij IDE Using Intellij IDE

راه اندازی Intellij Intellij Setup
راه اندازی پروژه Project Setup
نوشتن اولین برنامه Spark در IDE Writing first Spark program on IDE
درک پیکربندی جرقه Understanding spark configuration
افزودن اقدامات/تحولات Adding Actions/Transformations
درک برنامه اجرایی Understanding Execution Plan

اجرای Spark در EMR (AWS Cloud) Running Spark on EMR (AWS Cloud)

نمای کلی خوشه EMR EMR Cluster Overview
راه اندازی خوشه Cluster Setup
تنظیم کد جرقه برای EMR Setting Spark Code for EMR
با استفاده از Spark-submit Using Spark-submit
اجرای Spark در خوشه EMR Running Spark on EMR Cluster

جرقه با کاساندرا Spark with Cassandra

دوره کاساندرا Cassandra Course
ایجاد Spark RDD از جدول Cassandra Creating Spark RDD from Cassandra Table
پردازش داده های کاساندرا در Spark Processing Cassandra data in Spark
ردیف های کاساندرا به کلاس موردی Cassandra Rows to Case Class
ذخیره Spark RDD در Cassandra Saving Spark RDD to Cassandra

شروع کار با MongoDB Getting Started with MongoDB

معرفی MongoDB MongoDB Intro
MongoDB Usecase & Limitations MongoDB Usecase & Limitations
نصب MongoDB MongoDB Installation

عملیات CRUD CRUD Operations

پیدا کردن Find
پیدا کردن با فیلتر Find With Filter
درج کنید Insert
به روز رسانی Update
به روز رسانی ادامه دارد Update Continues
طرح ها Projections
حذف Delete

کار با اپراتورها Working with Operators

در/نه در اپراتورها In / not in Operators
اپراتورهای gte/lte gte / lte Operators
و/یا اپراتورها and / or operators
عملگر regex regex operator

قطب نما MongoDB MongoDB Compass

کار با رابط کاربری گرافیکی Working with GUI

مونگو پیشرفته Advanced Mongo

اعتبارسنجی/طرحواره Validation/Schema
کار با شاخص ها Working with Indexes

جرقه با مونگو Spark with Mongo

ادغام Spark Mongo Spark Mongo Integration

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش Master Big Data - Apache Spark/Hadoop/Sqoop/Hive/Flume/Mongo

جزییات دوره

زمان دوره: 11.5 hours

تعداد ویدیو ها: 126

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 10,334

امتیاز مرجع: 4.1 از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Navdeep Kaur

لینک کوتاه این دوره

https://donyad.com/d/f9fb4a

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Navdeep Kaur

TechnoAvengers.com (مerسس) من یک معمار داده بزرگ با 11 سال سابقه صنعت در فناوری ها و حوزه های مختلف هستم. من علاقه زیادی به ارائه آموزش در زمینه فناوری های جدید دارم. من گواهینامه توسعه دهنده CCA175 Hadoop and Spark و گواهینامه معمار راه حل AWS را دریافت کرده ام. من عاشق هدایت مردم و کمک به آنها برای رسیدن به اهداف جدید هستم.

دنیاد

بازاریابی

دیگر

آموزش Master Big Data - Apache Spark/Hadoop/Sqoop/Hive/Flume/Mongo

Master Big Data - Apache Spark/Hadoop/Sqoop/Hive/Flume/Mongo

معرفی کلان داده Big Data Introduction

معرفی دوره Course Intro

معرفی کلان داده Big Data Intro

درک اکوسیستم کلان داده Understanding Big Data Ecosystem

راه اندازی محیط Environment Setup

اصلاحات کلاستر GCP GCP Cluster Fixes

راه اندازی کلاستر در Google Cloud Cluster Setup on Google Cloud

به روز رسانی محیط زیست Environment Update

هادوپ و نخ Hadoop & Yarn

دستورات HDFS و Hadoop HDFS and Hadoop Commands

بررسی اجمالی خوشه نخ Yarn Cluster Overview

Sqoop Import Sqoop Import

Sqoop مقدمه Sqoop Introduction

مدیریت فهرست های هدف Managing Target Directories

کار با فرمت فایل پارکت Working with Parquet File Format

کار با فرمت فایل Avro Working with Avro File Format

کار با فشرده سازی های مختلف Working with Different Compressions

واردات مشروط Conditional Imports

پرس و جوهای تقسیم شده و مرزی Split-by and Boundary Queries

جداکننده های میدان Field delimeters

ضمائم افزایشی Incremental Appends

Sqoop-Hive Cluster Fix Sqoop-Hive Cluster Fix

واردات کندو Sqoop Sqoop Hive Import

Sqoop List جداول/پایگاه داده Sqoop List Tables/Database

Sqoop Assignment1 Sqoop Assignment1

Sqoop Assignment2 Sqoop Assignment2

Sqoop Import Practice1 Sqoop Import Practice1

Sqoop Import Practice2 Sqoop Import Practice2

Sqoop Export Sqoop Export

صادرات از Hdfs به Mysql Export from Hdfs to Mysql

صادرات از Hive به Mysql Export from Hive to Mysql

Avro فشرده شده را به Mysql صادر کنید Export Avro Compressed to Mysql

سخنرانی جایزه: Sqoop with Airflow Bonus Lecture: Sqoop with Airflow

آپاچی فلوم Apache Flume

معرفی فلوم و معماری Flume Introduction & Architecture

Exec Source و Logger Sink Exec Source and Logger Sink

انتقال داده ها از توییتر به HDFS Moving data from Twitter to HDFS

انتقال داده ها از NetCat به HDFS Moving data from NetCat to HDFS

رهگیرهای فلوم Flume Interceptors

مثال Flume Interceptor Flume Interceptor Example

فلوم چند عامل جریان Flume Multi-Agent Flow

تثبیت فلوم Flume Consolidation

Apache Hive Apache Hive

معرفی کندو Hive Introduction

پایگاه داده Hive Hive Database

جداول مدیریت شده Hive Hive Managed Tables

جداول خارجی کندو Hive External Tables

درج کندو Hive Inserts

Hive Analytics Hive Analytics

کار با پارکت Working with Parquet

فشرده سازی پارکت Compressing Parquet

کار با فرمت فایل ثابت Working with Fixed File Format

تغییر فرمان Alter Command

توابع رشته کندو Hive String Functions

توابع تاریخ کندو Hive Date Functions

پارتیشن بندی کندو Hive Partitioning

سطل سازی کندو Hive Bucketing

جرقه با نخ و HDFS Spark with Yarn & HDFS

آپاچی اسپارک چیست؟ What is Apache Spark

درک مدیر خوشه (نخ) Understanding Cluster Manager (Yarn)

آشنایی با فضای ذخیره سازی توزیع شده (HDFS) Understanding Distributed Storage (HDFS)

Running Spark در Yarn/HDFS Running Spark on Yarn/HDFS

آشنایی با Deploy Modes Understanding Deploy Modes

خوشه GCS GCS Cluster

جرقه در GCS Cluster Spark on GCS Cluster

لوازم داخلی اسپارک Spark Internals

رانندگان و مجریان Drivers & Executors

RDDs و Dataframes RDDs & Dataframes

تحول و اقدامات Transformation & Actions

تحولات گسترده و باریک Wide & Narrow Transformations

درک برنامه اجرایی Understanding Execution Plan

طرح های مختلف توسط راننده Different Plans by Driver

Spark RDD: Transformation & Actions Spark RDD : Transformation & Actions

تبدیل نقشه/نقشه مسطح Map/FlatMap Transformation

فیلتر/تقاطع Filter/Intersection

اتحاد/تحول متمایز Union/Distinct Transformation