لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش آپاچی اسپارک در 7 روز [ویدئو]
Apache Spark in 7 Days [Video]
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
اگر به دنبال یادگیری اصول اولیه Apache Spark در مدت زمان کوتاهی هستید، میتوانید روی این دوره حساب کنید تا به شما در یادگیری اصول اولیه این موتور کمک کند. Spark در حال تبدیل شدن به یک موتور پردازش کلان داده محبوب با توانایی منحصر به فرد خود برای اجرا در حافظه با سرعت عالی است. همچنین استفاده از آن آسان است و نحو ساده ای را ارائه می دهد.
این دوره به گونه ای طراحی شده است که به شما درک اساسی و تجربه عملی در نوشتن کدهای اولیه و همچنین اجرای برنامه های کاربردی در یک کلاستر Spark بدهد. در طی 7 روز، روی مثالها و تکالیف جالبی کار خواهید کرد که به شما کمک میکنند عملیاتهای اساسی، پرسوجو، یادگیری ماشینی و جریان را درک کنید.
در پایان این دوره، شما قادر خواهید بود یادگیری خود را تمرین کنید و پروژه های خود را با سهولت و اطمینان بسازید.
بسته کد این دوره ویدیویی در دسترس است -
https://github.com/PacktPublishing/Apache-Spark-in-7-Days •با استفاده از اسکریپت Python EC2 (Amazon Elastic Compute Cloud) با نحوه استقرار یک خوشه Spark در ابر AWS (سرویس وب آمازون) آشنا شوید.
•مفاهیم اساسی اسپارک، از جمله دگرگونی ها و کنش ها را مطالعه کنید
• کشف کنید که RDD ها (مجموعه های داده توزیع شده انعطاف پذیر) چیست و چگونه عملیات را روی آنها انجام دهید
• اجرای نمایش داده شد با استفاده از Spark SQL
• Query های Spark SQL را بنویسید و با Spark DataFrames کار کنید
• نحوه استفاده از MLlib برای برنامه های کاربردی یادگیری ماشین را بدانید
• عملیات جریان را کشف کنید
اگر شما یک توسعه دهنده، تحلیلگر داده، مهندس داده یا دانشمند داده باشید، این دوره به ویژه مفید خواهد بود. با این حال، هر فردی که علاقه مند به یادگیری نحوه استفاده از Spark باشد نیز از این دوره بهره خواهد برد. دانش برنامه نویسی پایتون فرض می شود اما تجربه قبلی کار با Spark لازم نیست. •راهنمای عملی Apache Spark را دریافت کنید تا با داده های بزرگ در 7 روز به سرعت عمل کنید * * • با کار بر روی سیستم های جریان داده، پردازش داده های بزرگ و موارد دیگر، اصول Apache Spark را درک کنید * * • کار بر روی عملیات و وظایف Spark برای نوشتن و برنامه ها را با استفاده از پایتون با سرعت تست کنید
سرفصل ها و درس ها
شروع شدن
Getting Started
بررسی اجمالی دوره
The Course Overview
راه اندازی یک حساب AWS
Setting Up an AWS Account
راه اندازی یک خوشه جرقه در EC2
Launching a Spark Cluster on EC2
تنظیم محیط
Setting Up Your Environment
اجرای یک برنامه آزمایشی
Running a Test Application
کار با RDD
Working with RDDs
ایجاد RDD
Creating RDDs
اقدامات
Actions
تحولات
Transformations
عملیات پیوستن، تنظیم و عددی
Joins, Set, and Numeric Operations
متغیرهای مشترک
Shared Variables
DataFrames
DataFrames
نصب نوت بوک Jupyter
Installing Jupyter Notebook
RDD ها و DataFrame ها
RDDs and DataFrames
عملیات ردیف DataFrame
DataFrame Row Operations
عملیات ستون DataFrame
DataFrame Column Operations
دستکاری DataFrame
DataFrame Manipulation
Spark SQL
Spark SQL
بازدیدها
Views
طرحواره ها
Schemas
عملیات SQL
SQL Operations
گزینه های I/O
I/O Options
HIVE
HIVE
مبانی یادگیری ماشین
Machine Learning Fundamentals
آمار پایه
Basic Statistics
خطوط لوله
Pipelines
استخراج کننده های ویژگی
Feature Extractors
ترانسفورماتورهای ویژه
Feature Transformers
انتخابگرهای ویژگی
Feature Selectors
مدل های یادگیری ماشین
Machine Learning Models
طبقه بندی
Classification
پسرفت
Regression
خوشه بندی
Clustering
فیلتر مشارکتی
Collaborative Filtering
انتخاب و تنظیم مدل
Model Selection and Tuning
جریان
Streaming
DSstreams
DStreams
عملیات پنجره DStream
DStream Window Operations
جریان ساخت یافته
Structured Streaming
عملیات پنجره
Window Operations
پیوستن به داده های دسته ای و جریانی
Joining Batch and Streaming Data
نمایش نظرات
Packtpub یک ناشر دیجیتالی کتابها و منابع آموزشی در زمینه فناوری اطلاعات و توسعه نرمافزار است. این شرکت از سال 2004 فعالیت خود را آغاز کرده و به تولید و انتشار کتابها، ویدیوها و دورههای آموزشی میپردازد که به توسعهدهندگان و متخصصان فناوری اطلاعات کمک میکند تا مهارتهای خود را ارتقا دهند. منابع آموزشی Packtpub موضوعات متنوعی از جمله برنامهنویسی، توسعه وب، دادهکاوی، امنیت سایبری و هوش مصنوعی را پوشش میدهد. محتوای این منابع به صورت کاربردی و بهروز ارائه میشود تا کاربران بتوانند دانش و تواناییهای لازم برای موفقیت در پروژههای عملی و حرفهای خود را کسب کنند.
کارن یانگ بیش از 6 سال است که یک خودآموز پرشور در علوم کامپیوتر بوده است. او دارای برنامه نویسی، پردازش داده های بزرگ و تجربه مهندسی است. علایق اخیر او شامل محاسبات ابری است. او قبلاً به مدت 5 سال در یک برنامه عصرانه بزرگسالان کالج تدریس می کرد.
نمایش نظرات