لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش عملی PySpark: پردازش دادههای حجیم
- آخرین آپدیت
دانلود PySpark in Action: Hands-On Data Processing
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
دوره «PySpark در عمل: پردازش عملی دادهها» یک دوره کاربردی است که شما را برای کار با اعتماد به نفس با دادههای مقیاس بزرگ با استفاده از PySpark و چارچوبهای پردازش توزیعشده آماده میکند. شما با مفاهیم بنیادی کلانداده (Big Data)، آپاچی هادوپ (Apache Hadoop) و آپاچی اسپارک (Apache Spark) آشنا خواهید شد و سپس این دانش را از طریق تمرینات واقعی که در آن مجموعهدادههای عظیم را پردازش و تحلیل میکنید، گسترش خواهید داد.
در طول این دوره، تجربیات عملی در زمینههای زیر کسب خواهید کرد:
- مفاهیم پایه کلانداده و اجزای اکوسیستم هادوپ مانند HDFS، که شما را قادر میسازد ذخیرهسازی و پردازش مدرن دادهها را درک کنید.
- معماری اسپارک و اصول طراحی حیاتی برای جریانهای کاری دادههای مقیاسپذیر و مقاوم در برابر خطا.
- تبدیلها (Transformations) و اکشنهای (Actions) RDD که به شما کمک میکند مجموعهدادههای بزرگ را با استفاده از موتور پردازش توزیعشده PySpark مدیریت کنید.
- تکنیکهای پیشرفته DataFrame: مدیریت انواع دادههای پیچیده، انجام تجمیعها (Aggregations) و حل بهینه چالشهای دادههای تجاری.
- استفاده از PySpark SQL برای اجرای کوئریهای پیشرفته، بهینهسازی جریانهای پردازش و تحلیل سریع و قابل اعتماد در مقیاس بالا.
این دوره برای کسانی که در مهندسی داده یا محاسبات توزیعشده تازهکار هستند و به دنبال یک شروع عملی با PySpark برای وظایف دادههای حجیم میباشند، ایدهآل است. اگر مهارتهای پایه پایتون را دارید اما تجربه قبلی در مهندسی داده ندارید، توضیحات قابل فهم و پروژههای گامبهگام در سراسر دوره در دسترس شما خواهد بود.
در پایان دوره، شما آماده خواهید بود تا از PySpark در پروژههای واقعی استفاده کنید، خط لولههای داده (Data Pipelines) را بسازید و نظارت کنید، پردازشها را خودکار کنید، مجموعهدادههای متنوع را پاکسازی و ادغام نمایید و با اعتماد به نفس با چالشهای اصلی تحلیل دادههای توزیعشده مقابله کنید.
سرفصل ها و درس ها
پردازش کلانداده با PySpark
Big Data Processing with PySpark
معرفی دوره
Course Introduction
کلانداده (Big Data) چیست؟
What is Big Data?
کاربردهای کلانداده
Applications of Big Data
هادوپ (Hadoop) چیست؟
What is Hadoop?
اکوسیستم هادوپ
Hadoop Ecosystem
نحوه عملکرد HDFS
Working of HDFS
آشنایی با آپاچی اسپارک
Introduction to Apache Spark
معماری Master-Slave
Master-slave Architecture
معماری اسپارک
Spark Architecture
پردازش دادهها با آپاچی اسپارک
Data Processing with Apache Spark
گراف جهتدار بدون دور (DAG)
Directed Acyclic Graph (DAG)
معرفی اکوسیستم اسپارک
Introduction to Spark Ecosystem
نمایش نظرات