لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش جامع بیگ دیتا (Big Data) با اسپارک و هادوپ
- آخرین آپدیت
دانلود Introduction to Big Data with Spark and Hadoop
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره جامع و خودآموز IBM تمام مفاهیم کلیدی دادههای عظیم یا بیگ دیتا را به شما آموزش میدهد. در این مسیر، با ویژگیهای دادههای حجیم و کاربردهای تحلیل آنها آشنا خواهید شد و تجربه عملی کار با ابزارهای پردازش بیگ دیتا مانند Apache Hadoop و Apache Spark را کسب میکنید.
برنارد مار، بیگ دیتا را به عنوان ردپای دیجیتالی تعریف میکند که ما در عصر حاضر تولید میکنیم. شما دوره را با درک مفهوم بیگ دیتا و بررسی نحوه استخراج بینشهای کاربردی برای موارد مختلف آغاز خواهید کرد. همچنین با تکنولوژیهایی نظیر پردازش موازی (Parallel Processing)، مقیاسپذیری (Scaling) و موازیسازی دادهها آشنا میشوید.
در ادامه، با هادوپ (Hadoop) آشنا میشوید؛ یک چارچوب متنباز که پردازش توزیعشده دادههای حجیم را امکانپذیر میکند. شما کاربردهای حیاتی اکوسیستم هادوپ از جمله سیستم فایل توزیعشده (HDFS)، MapReduce و HBase را خواهید شناخت. همچنین با Hive، نرمافزار انبار داده که رابطی مشابه SQL برای پرسوجو و مدیریت بهینه مجموعهدادههای بزرگ فراهم میکند، آشنا میشوید.
سپس به بررسی Apache Spark خواهید پرداخت؛ موتور پردازشی متنباز که روشهای نوین ذخیرهسازی و استفاده از بیگ دیتا را ارائه میدهد. در این بخش یاد میگیرید چگونه از اسپارک برای استخراج تحلیلهای قابل اطمینان استفاده کنید و با اجزای تشکیلدهنده این پلتفرم آشنا میشوید.
شما مفاهیم DataFrames را یاد گرفته، عملیات پایه روی آنها را اجرا کرده و با SparkSQL کار خواهید کرد. همچنین بررسی میکنید که اسپارک چگونه درخواستهای برنامه شما را پردازش و نظارت میکند و چگونه میتوانید از طریق Spark Application UI روند اجرای کارها را ردیابی کنید.
این دوره شامل چندین آزمایشگاه عملی (Hands-on labs) است تا مفاهیم آموخته شده را پیادهسازی کنید. شما پروژههای هادوپ و اسپارک را با استفاده از ابزارهایی نظیر Docker، Kubernetes، Python و Jupyter Notebooks به اتمام خواهید رساند.
سرفصل ها و درس ها
بیگ دیتا چیست؟
What Is Big Data?
معرفی دوره
Course Introduction
بیگ دیتا چیست؟
What is Big Data?
تاثیرات دادههای عظیم
Impact of Big Data
پردازش موازی، مقیاسپذیری و موازیسازی دادهها
Parallel Processing, Scaling, and Data Parallelism
ابزارها و اکوسیستم بیگ دیتا
Big Data Tools and Ecosystem
متنباز و دادههای عظیم
Open Source and Big Data
فراتر از تبلیغات
Beyond the Hype
موارد کاربرد بیگ دیتا
Big Data Use Cases
آشنایی با اکوسیستم هادوپ
Introduction to the Hadoop Ecosystem
معرفی هادوپ
Introduction to Hadoop
آشنایی با MapReduce
Intro to MapReduce
اکوسیستم هادوپ
Hadoop Ecosystem
سیستم فایل HDFS
HDFS
آپاچی هایو (HIVE)
HIVE
آپاچی اچبیس (HBASE)
HBASE
آپاچی اسپارک
Apache Spark
چرا از آپاچی اسپارک استفاده کنیم؟
Why use Apache Spark?
نمایش نظرات