مقدمه ای بر Spark.
فرمانهای HDFS
دوره پایتون.
چرا Spark توسعه داده شد.
Spark چیست و ویژگیهای آن.
اجزای اصلی Spark.
مقدمه ای بر Spark.
فرمانهای HDFS
مقدمه ای بر SparkSession
اصول RDD
RDD چیست
خواص RDD
زمان استفاده از RDD
مشکلات RDD
ایجاد RDD
روش های مختلف برای ایجاد RDD
عملیات RDD
تحولات - سطح پایین
تحولات - انواع پیوستن
عملکردها - مجموع تجمعات
ترکیب و ترکیب
تحولات - تجمعات کلیدی
تحولات - مرتب سازی
تحولات - رتبه بندی
تحولات - تنظیم
تحولات - نمونه برداری
تحولات - پارتیشن
تغییرها - پارتیشن مجدد
تحولات - تقسیم مجدد و مرتب سازی
تحولات - ادغام
تغییرها - پارتیشن مجدد در مقابل ادغام
استخراج
Spark Cluster Execution Architecture_Full Architecture
Spark Cluster Execution Architecture_YARN به عنوان مدیر Spark Cluster
Spark Cluster Executure Architecture_JVMs در سراسر خوشه
معماری Spark Cluster Execution- اصطلاحات رایج در چارچوب اجرا
معماری اجرای خوشه جرقه - تحولات باریک و گسترده
معماری اجرای خوشه جرقه - زمانبندی DAG
معماری اجرای خوشه جرقه - زمانبندی کار
تداوم RDD
متغیرهای مشترک Spark
معماری SparkSQL
ویژگی های تفصیلی SparkSession
اصول DataFrame
انواع داده
ردیف های DataFrame
ستون های DataFrame
DataFrame ETL
DataFrame ETL_Introduction to Transformations and Extraction
استخراج معرفی APIهای DataFrame ETL_DataFrame
انتخاب APIهای DataFrame ETL_DataFrame
فیلتر APIهای DataFrame ETL_DataFrame یا Where
مرتبسازی APIهای DataFrame ETL_DataFrame
تنظیم APIهای DataFrame ETL_DataFrame
پیوستن به APIهای DataFrame ETL_DataFrame
تجمیع APIهای DataFrame ETL_DataFrame
DataFrame ETL_DataFrame APIs GroupBy
DataFrame ETL_DataFrame APIهای Windows
معرفی عملکردهای داخلی DataFrame ETL_DataFrame
عملکرد و بهینه سازی
مربی حرفه ای با 15 سال سابقه
نمایش نظرات