آموزش با مثال بیاموزید: Hadoop، MapReduce برای مشکلات کلان داده

Learn By Example: Hadoop, MapReduce for Big Data problems

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: تمرین عملی در Hadoop، MapReduce و هنر تفکر "موازی" توسعه برنامه های کاربردی MapReduce پیشرفته برای پردازش BigData بر هنر "تفکر موازی" مسلط شوید - چگونه یک کار را به نقشه تقسیم کنید/تحولات را کاهش دهید به طور خودکفا راه اندازی کنید خوشه mini-Hadoop خود را چه یک گره، یک خوشه فیزیکی یا در فضای ابری. از Hadoop + MapReduce برای حل طیف گسترده ای از مشکلات استفاده کنید: از NLP گرفته تا شاخص های معکوس گرفته تا توصیه ها درک HDFS، MapReduce و YARN و نحوه تعامل آنها با یکدیگر درک اصول تنظیم عملکرد و مدیریت کلاستر خود. یک IDE که در آن می توانید کد جاوا بنویسید یا کد منبعی که به اشتراک گذاشته شده است را باز کنید. IntelliJ و Eclipse هر دو گزینه های عالی هستند. شما به پیشینه ای در برنامه نویسی شی گرا، ترجیحاً در جاوا نیاز دارید. تمام کد منبع در جاوا است و ما بدون ورود به اشیا، کلاس‌ها و غیره وارد آن می‌شویم. کمی قرار گرفتن در معرض پوسته‌های لینوکس/یونیکس مفید خواهد بود، اما مسدودکننده نخواهد بود.

توسط  یک تیم 4 نفره شامل 2 تحصیلات دانشگاه استنفورد، Googler سابق  و 2 تحلیلگر ارشد سابق Flipkart تدریس می‌شود. این تیم چندین دهه تجربه عملی در کار با جاوا و با میلیاردها ردیف داده دارد.

این دوره یک تمرین بزرگ‌نمایی، بزرگ‌نمایی، است که شامل Hadoop، MapReduce و هنر تفکر موازی است.

بیایید آن را تجزیه کنیم.

بزرگنمایی، بزرگنمایی:   این دوره هم گسترده و هم عمیق است. اجزای منفرد Hadoop را با جزئیات کامل پوشش می‌دهد، و همچنین تصویر سطح بالاتری از نحوه تعامل آنها با یکدیگر به شما می‌دهد.

تمرین عملی شامل Hadoop، MapReduce:  این دوره شما را خیلی زود با Hadoop آشنا می‌کند. یاد خواهید گرفت که چگونه با استفاده از VM و Cloud، خوشه خود را راه‌اندازی کنید. تمام ویژگی های اصلی MapReduce پوشش داده شده است - از جمله موضوعات پیشرفته مانند مرتب سازی کل و مرتب سازی ثانویه.

هنر موازی فکر کردن: MapReduce طرز تفکر مردم را در مورد پردازش کلان داده کاملاً تغییر داد. تفکیک هر مشکلی به واحدهای موازی پذیر یک هنر است. مثال‌های این دوره به شما آموزش می‌دهند که «موازی فکر کنید».

موارد تحت پوشش:

چیزهای جالب زیادی ..

  • استفاده از MapReduce به


    • توصیه به دوستان در سایت شبکه اجتماعی:  با استفاده از یک الگوریتم فیلتر مشارکتی، 10 توصیه دوست برتر را ایجاد کنید.
    • ایجاد یک فهرست معکوس برای موتورهای جستجو:  از MapReduce برای موازی کردن کار عظیم ایجاد یک شاخص معکوس برای یک موتور جستجو استفاده کنید.
    • ایجاد Bigrams از متن: Bigrams تولید کنید و توزیع فرکانس آنها را در مجموعه‌ای از متن محاسبه کنید.


  • خوشه Hadoop خود را بسازید:


    • Hadoop را در حالت‌های مستقل، شبه توزیع شده و کاملاً توزیع شده نصب کنید
    • با استفاده از ماشین‌های مجازی لینوکس، یک خوشه hadoop راه‌اندازی کنید.
    • با مدیر Cloudera یک خوشه Hadoop ابری را در AWS تنظیم کنید.
    • درک HDFS، MapReduce و YARN و تعامل آنها 


  • مشاغل MapReduce خود را سفارشی کنید:


    • چندین کار MR را با هم زنجیره بزنید
    • پارتیشن‌کننده سفارشی خود را بنویسید
    • مرتب‌سازی کل:  با نمونه‌برداری از فایل‌های ورودی، حجم زیادی از داده‌ها را به صورت جهانی مرتب می‌کند
    • مرتب سازی ثانویه
    • تست واحد با MR Unit
    • با استفاده از Hadoop Streaming API با پایتون ادغام کنید


.. و البته تمام اصول اولیه: 

  • MapReduce:  Mapper، Reducer، Sort/Merge، Partitioning، Shuffle and Sort
  • HDFS  YARN:  Namenode، Datanode، Resource Manager، Node Manager، آناتومی برنامه MapReduce، YARN Scheduling، پیکربندی HDFS و YARN برای تنظیم عملکرد خوشه شما.

سرفصل ها و درس ها

معرفی Introduction

  • شما، این دوره و ما You, this course and Us

  • شما، این دوره و ما You, this course and Us

معرفی Introduction

چرا داده های بزرگ یک معامله بزرگ است؟ Why is Big Data a Big Deal

  • پارادایم کلان داده The Big Data Paradigm

  • پارادایم کلان داده The Big Data Paradigm

  • سریال در مقابل محاسبات توزیع شده Serial vs Distributed Computing

  • هادوپ چیست؟ What is Hadoop?

  • هادوپ چیست؟ What is Hadoop?

  • HDFS یا سیستم فایل توزیع شده Hadoop HDFS or the Hadoop Distributed File System

  • HDFS یا سیستم فایل توزیع شده Hadoop HDFS or the Hadoop Distributed File System

  • MapReduce معرفی شد MapReduce Introduced

  • MapReduce معرفی شد MapReduce Introduced

  • YARN یا یک مذاکره کننده منبع دیگر YARN or Yet Another Resource Negotiator

چرا داده های بزرگ یک معامله بزرگ است؟ Why is Big Data a Big Deal

  • سریال در مقابل محاسبات توزیع شده Serial vs Distributed Computing

  • YARN یا یک مذاکره کننده منبع دیگر YARN or Yet Another Resource Negotiator

نصب Hadoop در یک محیط محلی Installing Hadoop in a Local Environment

  • حالت های نصب Hadoop Hadoop Install Modes

  • حالت های نصب Hadoop Hadoop Install Modes

  • نصب حالت مستقل Hadoop Hadoop Standalone mode Install

  • نصب حالت شبه توزیع شده Hadoop Hadoop Pseudo-Distributed mode Install

نصب Hadoop در یک محیط محلی Installing Hadoop in a Local Environment

  • نصب حالت مستقل Hadoop Hadoop Standalone mode Install

  • نصب حالت شبه توزیع شده Hadoop Hadoop Pseudo-Distributed mode Install

MapReduce "Hello World" The MapReduce "Hello World"

  • فلسفه اساسی MapReduce The basic philosophy underlying MapReduce

  • MapReduce - تجسم و توضیح داده شده است MapReduce - Visualized And Explained

  • MapReduce - تجسم و توضیح داده شده است MapReduce - Visualized And Explained

  • MapReduce - در هر مرحله کمی عمیق تر حفاری کنید MapReduce - Digging a little deeper at every step

  • MapReduce - در هر مرحله کمی عمیق تر حفاری کنید MapReduce - Digging a little deeper at every step

  • "Hello World" در MapReduce "Hello World" in MapReduce

  • نقشه بردار The Mapper

  • نقشه بردار The Mapper

  • کاهنده The Reducer

  • کار The Job

  • کار The Job

MapReduce "Hello World" The MapReduce "Hello World"

  • فلسفه اساسی MapReduce The basic philosophy underlying MapReduce

  • "Hello World" در MapReduce "Hello World" in MapReduce

  • کاهنده The Reducer

یک کار MapReduce را اجرا کنید Run a MapReduce Job

  • با HDFS راحت باشید Get comfortable with HDFS

  • اولین MapReduce Job خود را اجرا کنید Run your first MapReduce Job

  • اولین MapReduce Job خود را اجرا کنید Run your first MapReduce Job

یک کار MapReduce را اجرا کنید Run a MapReduce Job

  • با HDFS راحت باشید Get comfortable with HDFS

آبگیری MapReduce - Combiners، Shuffle and Sort و Streaming API Juicing your MapReduce - Combiners, Shuffle and Sort and The Streaming API

  • فاز کاهش را موازی کنید - از Combiner استفاده کنید Parallelize the reduce phase - use the Combiner

  • همه Reducer ها Combiner نیستند Not all Reducers are Combiners

  • MapReduce شما چند نقشه کش و کاهش دهنده دارد؟ How many mappers and reducers does your MapReduce have?

  • MapReduce شما چند نقشه کش و کاهش دهنده دارد؟ How many mappers and reducers does your MapReduce have?

  • کاهش موازی با استفاده از Shuffle And Sort Parallelizing reduce using Shuffle And Sort

  • کاهش موازی با استفاده از Shuffle And Sort Parallelizing reduce using Shuffle And Sort

  • MapReduce به زبان جاوا محدود نمی شود - معرفی Streaming API MapReduce is not limited to the Java language - Introducing the Streaming API

  • پایتون برای MapReduce Python for MapReduce

  • پایتون برای MapReduce Python for MapReduce

آبگیری MapReduce - Combiners، Shuffle and Sort و Streaming API Juicing your MapReduce - Combiners, Shuffle and Sort and The Streaming API

  • فاز کاهش را موازی کنید - از Combiner استفاده کنید Parallelize the reduce phase - use the Combiner

  • همه Reducer ها Combiner نیستند Not all Reducers are Combiners

  • MapReduce به زبان جاوا محدود نمی شود - معرفی Streaming API MapReduce is not limited to the Java language - Introducing the Streaming API

HDFS و نخ HDFS and Yarn

  • HDFS - محافظت در برابر از دست دادن داده ها با استفاده از تکرار HDFS - Protecting against data loss using replication

  • HDFS - نام گره ها و دلیل مهم بودن آنها HDFS - Name nodes and why they're critical

  • HDFS - نام گره ها و دلیل مهم بودن آنها HDFS - Name nodes and why they're critical

  • HDFS - نقطه بازرسی برای پشتیبان گیری از اطلاعات گره نام HDFS - Checkpointing to backup name node information

  • نخ - اجزای اصلی Yarn - Basic components

  • نخ - اجزای اصلی Yarn - Basic components

  • Yarn - ارائه کار به Yarn Yarn - Submitting a job to Yarn

  • Yarn - ارائه کار به Yarn Yarn - Submitting a job to Yarn

  • نخ - خط‌مشی‌های زمان‌بندی را وصل کنید Yarn - Plug in scheduling policies

  • نخ - زمانبندی را پیکربندی کنید Yarn - Configure the scheduler

HDFS و نخ HDFS and Yarn

  • HDFS - محافظت در برابر از دست دادن داده ها با استفاده از تکرار HDFS - Protecting against data loss using replication

  • HDFS - نقطه بازرسی برای پشتیبان گیری از اطلاعات گره نام HDFS - Checkpointing to backup name node information

  • نخ - خط‌مشی‌های زمان‌بندی را وصل کنید Yarn - Plug in scheduling policies

  • نخ - زمانبندی را پیکربندی کنید Yarn - Configure the scheduler

MapReduce Customizations برای کنترل دانه بندی ظریف تر MapReduce Customizations For Finer Grained Control

  • تنظیم MapReduce خود برای پذیرش آرگومان های خط فرمان Setting up your MapReduce to accept command line arguments

  • ابزار، ToolRunner و GenericOptionsParser The Tool, ToolRunner and GenericOptionsParser

  • ابزار، ToolRunner و GenericOptionsParser The Tool, ToolRunner and GenericOptionsParser

  • پیکربندی ویژگی های شی Job Configuring properties of the Job object

  • پیکربندی ویژگی های شی Job Configuring properties of the Job object

  • سفارشی کردن پارتیشن‌کننده، مرتب‌سازی مقایسه‌کننده و مقایسه‌گر گروهی Customizing the Partitioner, Sort Comparator, and Group Comparator

  • سفارشی کردن پارتیشن‌کننده، مرتب‌سازی مقایسه‌کننده و مقایسه‌گر گروهی Customizing the Partitioner, Sort Comparator, and Group Comparator

MapReduce Customizations برای کنترل دانه بندی ظریف تر MapReduce Customizations For Finer Grained Control

  • تنظیم MapReduce خود برای پذیرش آرگومان های خط فرمان Setting up your MapReduce to accept command line arguments

شاخص معکوس، انواع داده های سفارشی برای کلیدها، شمارش بیگرام و تست های واحد! The Inverted Index, Custom Data Types for Keys, Bigram Counts and Unit Tests!

  • قلب موتورهای جستجو - شاخص معکوس The heart of search engines - The Inverted Index

  • قلب موتورهای جستجو - شاخص معکوس The heart of search engines - The Inverted Index

  • ایجاد شاخص معکوس با استفاده از MapReduce Generating the inverted index using MapReduce

  • انواع داده های سفارشی برای کلیدها - رابط قابل نوشتن Custom data types for keys - The Writable Interface

  • یک Bigram را با استفاده از WritableComparable نمایش دهید Represent a Bigram using a WritableComparable

  • یک Bigram را با استفاده از WritableComparable نمایش دهید Represent a Bigram using a WritableComparable

  • MapReduce برای شمارش Bigrams در متن ورودی MapReduce to count the Bigrams in input text

  • راه اندازی پروژه Hadoop خود Setting up your Hadoop project

  • راه اندازی پروژه Hadoop خود Setting up your Hadoop project

  • کار MapReduce خود را با استفاده از MRUnit آزمایش کنید Test your MapReduce job using MRUnit

  • کار MapReduce خود را با استفاده از MRUnit آزمایش کنید Test your MapReduce job using MRUnit

شاخص معکوس، انواع داده های سفارشی برای کلیدها، شمارش بیگرام و تست های واحد! The Inverted Index, Custom Data Types for Keys, Bigram Counts and Unit Tests!

  • ایجاد شاخص معکوس با استفاده از MapReduce Generating the inverted index using MapReduce

  • انواع داده های سفارشی برای کلیدها - رابط قابل نوشتن Custom data types for keys - The Writable Interface

  • MapReduce برای شمارش Bigrams در متن ورودی MapReduce to count the Bigrams in input text

فرمت های ورودی و خروجی و پارتیشن بندی سفارشی Input and Output Formats and Customized Partitioning

  • معرفی فرمت ورودی فایل Introducing the File Input Format

  • معرفی فرمت ورودی فایل Introducing the File Input Format

  • فرمت های فایل متنی و ترتیبی Text And Sequence File Formats

  • پارتیشن بندی داده ها با استفاده از یک پارتیشن سفارشی Data partitioning using a custom partitioner

  • پارتیشن بندی داده ها با استفاده از یک پارتیشن سفارشی Data partitioning using a custom partitioner

  • پارتیشن‌کننده سفارشی را در کد واقعی کنید Make the custom partitioner real in code

  • پارتیشن‌کننده سفارشی را در کد واقعی کنید Make the custom partitioner real in code

  • پارتیشن بندی کل سفارش Total Order Partitioning

  • پارتیشن بندی کل سفارش Total Order Partitioning

  • نمونه گیری ورودی، توزیع، پارتیشن بندی و پیکربندی اینها Input Sampling, Distribution, Partitioning and configuring these

  • نمونه گیری ورودی، توزیع، پارتیشن بندی و پیکربندی اینها Input Sampling, Distribution, Partitioning and configuring these

  • مرتب سازی ثانویه Secondary Sort

فرمت های ورودی و خروجی و پارتیشن بندی سفارشی Input and Output Formats and Customized Partitioning

  • فرمت های فایل متنی و ترتیبی Text And Sequence File Formats

  • مرتب سازی ثانویه Secondary Sort

سیستم های توصیه با استفاده از فیلتر مشارکتی Recommendation Systems using Collaborative Filtering

  • مقدمه ای بر فیلتر مشارکتی Introduction to Collaborative Filtering

  • مقدمه ای بر فیلتر مشارکتی Introduction to Collaborative Filtering

  • توصیه های دوستان با استفاده از مشاغل زنجیره ای MR Friend recommendations using chained MR jobs

  • برای هر جفت کاربر دوستان مشترک پیدا کنید - اولین MapReduce Get common friends for every pair of users - the first MapReduce

  • 10 توصیه دوست برتر برای هر کاربر - MapReduce دوم Top 10 friend recommendation for every user - the second MapReduce

  • 10 توصیه دوست برتر برای هر کاربر - MapReduce دوم Top 10 friend recommendation for every user - the second MapReduce

سیستم های توصیه با استفاده از فیلتر مشارکتی Recommendation Systems using Collaborative Filtering

  • توصیه های دوستان با استفاده از مشاغل زنجیره ای MR Friend recommendations using chained MR jobs

  • برای هر جفت کاربر دوستان مشترک پیدا کنید - اولین MapReduce Get common friends for every pair of users - the first MapReduce

Hadoop به عنوان یک پایگاه داده Hadoop as a Database

  • داده های ساخت یافته در Hadoop Structured data in Hadoop

  • اجرای SQL Select با MapReduce Running an SQL Select with MapReduce

  • اجرای یک گروه SQL توسط MapReduce Running an SQL Group By with MapReduce

  • پیوستن به MapReduce - سمت نقشه A MapReduce Join - The Map Side

  • یک MapReduce Join - The Reduce Side A MapReduce Join - The Reduce Side

  • پیوستن به MapReduce - مرتب سازی و پارتیشن بندی A MapReduce Join - Sorting and Partitioning

  • یک MapReduce Join - قرار دادن همه آن در کنار هم A MapReduce Join - Putting it all together

Hadoop به عنوان یک پایگاه داده Hadoop as a Database

  • داده های ساخت یافته در Hadoop Structured data in Hadoop

  • اجرای SQL Select با MapReduce Running an SQL Select with MapReduce

  • اجرای یک گروه SQL توسط MapReduce Running an SQL Group By with MapReduce

  • پیوستن به MapReduce - سمت نقشه A MapReduce Join - The Map Side

  • یک MapReduce Join - The Reduce Side A MapReduce Join - The Reduce Side

  • پیوستن به MapReduce - مرتب سازی و پارتیشن بندی A MapReduce Join - Sorting and Partitioning

  • یک MapReduce Join - قرار دادن همه آن در کنار هم A MapReduce Join - Putting it all together

K-Means Clustering K-Means Clustering

  • K-Means Clustering چیست؟ What is K-Means Clustering?

  • یک کار MapReduce برای K-Means Clustering A MapReduce job for K-Means Clustering

  • یک کار MapReduce برای K-Means Clustering A MapReduce job for K-Means Clustering

  • K-Means Clustering - اندازه گیری فاصله بین نقاط K-Means Clustering - Measuring the distance between points

  • K-Means Clustering - Writable های سفارشی برای ورودی/خروجی K-Means Clustering - Custom Writables for Input/Output

  • K-Means Clustering - Writable های سفارشی برای ورودی/خروجی K-Means Clustering - Custom Writables for Input/Output

  • K-Means Clustering - پیکربندی کار K-Means Clustering - Configuring the Job

  • K-Means Clustering - پیکربندی کار K-Means Clustering - Configuring the Job

  • K-Means Clustering - The Mapper and Reducer K-Means Clustering - The Mapper and Reducer

  • K-Means Clustering - The Mapper and Reducer K-Means Clustering - The Mapper and Reducer

  • K-Means Clustering: The Iterative MapReduce Job K-Means Clustering : The Iterative MapReduce Job

  • K-Means Clustering: The Iterative MapReduce Job K-Means Clustering : The Iterative MapReduce Job

K-Means Clustering K-Means Clustering

  • K-Means Clustering چیست؟ What is K-Means Clustering?

  • K-Means Clustering - اندازه گیری فاصله بین نقاط K-Means Clustering - Measuring the distance between points

راه اندازی Hadoop Cluster Setting up a Hadoop Cluster

  • پیکربندی دستی خوشه Hadoop (VMهای لینوکس) Manually configuring a Hadoop cluster (Linux VMs)

  • پیکربندی دستی خوشه Hadoop (VMهای لینوکس) Manually configuring a Hadoop cluster (Linux VMs)

  • شروع کار با خدمات وب آمازون Getting started with Amazon Web Servicies

  • شروع کار با خدمات وب آمازون Getting started with Amazon Web Servicies

  • یک Hadoop Cluster را با Cloudera Manager در AWS راه اندازی کنید Start a Hadoop Cluster with Cloudera Manager on AWS

  • یک Hadoop Cluster را با Cloudera Manager در AWS راه اندازی کنید Start a Hadoop Cluster with Cloudera Manager on AWS

راه اندازی Hadoop Cluster Setting up a Hadoop Cluster

ضمیمه Appendix

  • راه اندازی یک نمونه لینوکس مجازی (برای کاربران ویندوز) Setup a Virtual Linux Instance (For Windows users)

  • راه اندازی یک نمونه لینوکس مجازی (برای کاربران ویندوز) Setup a Virtual Linux Instance (For Windows users)

  • [برای مبتدیان شل سیستم عامل لینوکس/مک] مسیر و سایر متغیرهای محیطی [For Linux/Mac OS Shell Newbies] Path and other Environment Variables

  • [برای مبتدیان شل سیستم عامل لینوکس/مک] مسیر و سایر متغیرهای محیطی [For Linux/Mac OS Shell Newbies] Path and other Environment Variables

ضمیمه Appendix

نمایش نظرات

نظری ارسال نشده است.

آموزش با مثال بیاموزید: Hadoop، MapReduce برای مشکلات کلان داده
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
13.5 hours
73
Udemy (یودمی) udemy-small
01 شهریور 1397 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
8,982
4.7 از 5
دارد
دارد
دارد

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Loony Corn Loony Corn

یک تیم سابق گوگل، استنفورد و فلیپ کارت

Loony Corn Loony Corn

یک تیم سابق گوگل، استنفورد و فلیپ کارت

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.