این دوره درباره AWS Glue Studio - A Server less ETL Framework است.
AWS Glue یک سرویس یکپارچهسازی اطلاعات کمتر سرور است که کشف، آمادهسازی و ترکیب دادهها را برای تجزیه و تحلیل، یادگیری ماشین و توسعه برنامهها آسان میکند. AWS Glue همه قابلیتهای مورد نیاز برای یکپارچهسازی دادهها را فراهم میکند تا بتوانید به جای چند ماه، در عرض چند دقیقه شروع به تجزیه و تحلیل دادههای خود و استفاده از آنها کنید.
این دوره برای،
مفید استتوسعه دهندگان ETL
مهندسین داده
معماران ETL
متخصصان انتقال داده
مدیران پایگاه داده
توسعه دهندگان پایگاه داده
یکپارچهسازی دادهها فرآیند آمادهسازی و ترکیب دادهها برای تجزیه و تحلیل، یادگیری ماشین و توسعه برنامه است. این شامل وظایف متعدد، مانند کشف و استخراج داده ها از منابع مختلف است. غنی سازی، تمیز کردن، عادی سازی و ترکیب داده ها؛ و بارگذاری و سازماندهی داده ها در پایگاه های داده، انبارهای داده و دریاچه های داده. این وظایف اغلب توسط انواع مختلفی از کاربران انجام می شود که هر کدام از محصولات متفاوتی استفاده می کنند.
چسب AWS از منابع داده زیر پشتیبانی می کند:
¤ذخیرههای داده
¤Amazon S3
¤سرویس پایگاه داده رابطهای آمازون (آمازون RDS)
¤ پایگاه داده های شخص ثالث قابل دسترسی JDBC
¤Amazon DynamoDB
¤MongoDB و Amazon DocumentDB (با سازگاری MongoDB)
¤جریانهای داده
¤آمازون کینسیس جریان داده
¤آپاچی کافکا
AWS Glue Studio یک رابط گرافیکی جدید است که ایجاد، اجرا و نظارت بر استخراج، تبدیل، و بارگذاری (ETL) کارهای در AWS Glue را آسان می کند. میتوانید گردشهای کاری تبدیل دادهها را بهصورت بصری بنویسید و بهطور یکپارچه آنها را روی موتور ETL مبتنی بر Apache Spark AWS Glue اجرا کنید. میتوانید طرح و نتایج دادهها را در هر مرحله از کار بررسی کنید.
معمار توسعه نرم افزار
نمایش نظرات