لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش دریاچه داده در AWS - ساده ترین راه برای یادگیری [2023]
Data Lake in AWS - Easiest Way to Learn [2023]
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
Hands-on - Glue, Athena, S3, ETL, Spark, Parket, QuickSight, Kinesis, Lambda, Comprehend AI درباره مولفه های کلیدی Data Lake در مقابل Data Warehouse اطلاعات فایل های Query معماری Data Lake مستقیماً با استفاده از ادغام SQL Hands-on با استفاده از Kinesis Firehose، Lambda، Comprehend AI، Glue، Athena و S3 پیش نیازها: دانش اولیه AWS مفید است اما اجباری نیست.
سلام، نام من چاندرا لینگام است، و من مربی شما برای دریاچه داده در دوره AWS خواهم بود.
در این دوره، ما با درک مفاهیم اساسی دریاچه داده و اینکه چه زمانی راه حل مناسب در مقابل انبار داده است، شروع خواهیم کرد
سپس به مؤلفههای مختلفی که راهحل دریاچه داده را تشکیل میدهند، از جمله توانایی جستجوی مستقیم فایلها با استفاده از SQL برای تجزیه و تحلیل موقتی سریع مجموعههای داده میپردازیم.
در طول دوره، موضوع مدیریت تغییرات در ساختار فایلها در دریاچه داده را پوشش خواهیم داد. ما به سناریوهای مختلف مانند فیلدهای جدید، پارتیشنهای جدید، تغییرات در انواع دادهها و دادههای از دست رفته میپردازیم و در مورد تکنیکهای نحوه مدیریت موثر آنها بحث خواهیم کرد. همچنین با تمرکز بر به حداقل رساندن اختلال در سیستم های پایین دستی، به مدیریت کاتالوگ چسب و تکامل طرحواره ها می پردازیم
ما همچنین به فرمت های مختلف داده مانند CSV، Parquet، Avro و ORC نگاه خواهیم کرد و نقاط قوت و ضعف مربوطه را بررسی خواهیم کرد. پس از آن، به Glue ETL، یک راه حل قوی مبتنی بر اسپارک Apache برای تبدیل داده ها می پردازیم.
این دوره پر از تمرین ها و پروژه های عملی است.
شما یک مجموعه داده رتبه بندی دانشگاه را تجزیه و تحلیل خواهید کرد که درک آن آسان، مفید است و ترکیبی از انواع داده ها با بسیاری از مسائل مربوط به کیفیت داده است.
میآموزید که از Athena برای جستجوی دادهها استفاده کنید، با مشکلات کیفیت دادهها از طریق SQL مقابله کنید، و دادهها را با استفاده از Glue - Apache Spark ETL پاک کنید.
بهعلاوه، این دوره تکنیکهایی را برای سادهسازی پرسشها با استفاده از نماها و تجسم دادهها با استفاده از Amazon QuickSight پوشش میدهد.
برای نشان دادن مقیاس پذیری آتنا، مجموعه داده بزرگ نظرات مشتریان آمازون را که شامل بیش از 130 میلیون بررسی است، پرس و جو می کنیم. در نهایت، ما یک برنامه بدون سرور با استفاده از Kinesis Firehose، Lambda، Comprehend AI، Glue، Athena و S3 خواهیم ساخت که می تواند تعداد نامحدودی از نظرات مشتریان را پردازش کند، تجزیه و تحلیل احساسات انجام دهد و نتایج را در دریاچه داده برای پرس و جو ذخیره کند.
من مشتاقم که به زودی شما را ملاقات کنم!
متشکرم!
چاندرا لینگام
محاسبه با Cloud Inc
سرفصل ها و درس ها
معرفی
Introduction
مقدمه ای بر دریاچه داده
Introduction to Data Lake
منابع قابل دانلود
Downloadable Resources
سرعت یادگیری را افزایش دهید
Increase the speed of learning
ذخیره سازی، مصرف داده ها و مهاجرت به دریاچه داده
Storage, Data Ingestion and Migration to a Data Lake
کاتالوگ داده و مرداب داده
Data Catalog and Data Swamp
فرمت های داده محبوب
Popular Data Formats
تبدیل داده ها
Data Transformation
برای پرسش و پاسخ زنده - هر ماه به ما بپیوندید!
Join us for the Live Q&A - Every Month!
مصاحبه Udemy - شیرجه عمیق به گواهینامه های AWS
Udemy Interview - A Deep Dive Into AWS Certifications
پرس و جو و تجزیه و تحلیل
Querying and Analytics
ابزارهای پرس و جو و تجزیه و تحلیل در محل
In-place Querying and Analytics Tools
جریان در مقابل تجزیه و تحلیل دسته ای
Streaming vs. Batch Analysis
Kinesis - پردازش و تجزیه و تحلیل داده های جریان
Kinesis - Process and Analyze Streaming Data
آزمایشگاه - حساب AWS و تنظیمات کاربر
Lab - AWS Account and User Setup
تنظیمات حساب
Account Setup
آزمایشگاه - راه اندازی حساب AWS، پیشنهادات ردیف رایگان، صورتحساب، پشتیبانی
Lab - AWS Account Setup, Free Tier Offers, Billing, Support
نمایش نظرات