لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش شروع کار با پلتفرم Databricks Lakehouse
Getting Started with the Databricks Lakehouse Platform
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره آموزشی به شما می آموزد که چگونه معماری Data Lakehouse بهترین ها را از هر دو نوع Data Lakes و Data Warehouse به شما می دهد و به شما امکان می دهد نیازهای داده خود را برای پردازش کلان داده، تجزیه و تحلیل SQL و یادگیری ماشین در یک پلت فرم واحد برآورده کنید. سازمان ها مدت هاست که داده ها را در یک پلت فرم جمع آوری کرده اند. انواع فرمت ها، داده های ساخت یافته، بدون ساختار و نیمه ساختار یافته. با این حال، کار با دادهها در قالبهای مختلف برای موارد استفاده مختلف، به انبارهای داده پلتفرم متعدد برای دادههای ساختاریافته مورد نیاز برای هوش تجاری و دریاچههای داده برای دادههای بدون ساختار مورد نیاز برای علم داده و یادگیری ماشین نیاز دارد. معماری دریاچه داده Databricks یک پارادایم نوآورانه است که انعطاف پذیری و کارایی یک دریاچه داده را با قابلیت اطمینان و ویژگی های یک انبار داده ترکیب می کند. در این دوره آموزشی، شروع به کار با پلتفرم Databricks Lakehouse، با اهمیت ذخیره سازی داده ها در یک مخزن متمرکز و اینکه چگونه دریاچه های داده و انبارهای داده برای حل مشکلات مختلف مربوط به داده ها خدمت می کنند، آشنا خواهید شد. ابتدا، انواع فنآوریها را در فضای تحلیلی و اینکه چگونه پلتفرم lakehouse نقاط قوت آنها را در بر میگیرد و محدودیتهای آنها را کاهش میدهد، کشف خواهید کرد. در مرحله بعد، اجزای اساسی تشکیل دهنده معماری یک خانه دریاچه داده و اینکه چگونه پلتفرم Databricks Lakehouse از Delta Lakes برای فعال کردن تجزیه و تحلیل SQL و علم داده و یادگیری ماشین با استفاده از ذخیره سازی دریاچه داده های زیرین استفاده می کند، خواهید فهمید. در نهایت، Databricks Data Lakehouse را در Microsoft Azure بررسی خواهید کرد. شما Lakehouse داده را می سازید، داده ها را در جداول دلتا ذخیره می کنید و با استفاده از Apache Spark و پرس و جوهای SQL به همان داده ها دسترسی خواهید داشت. پس از اتمام این دوره، میتوانید به وضوح بیان کنید که چگونه پلت فرم داده lakehouse به کاهش چالشها با معماری دادههای فعلی کمک میکند و به طور عملی میدانید که چگونه میتوانید lakehouse را در Databricks راهاندازی و استفاده کنید.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
معرفی پلتفرم Lakehouse
Introducing the Lakehouse Platform
پیش نیازها و رئوس مطالب دوره
Prerequisites and Course Outline
اطلاعات بزرگ
Big Data
سیلوهای داده
Data Silos
انبارهای داده
Data Warehouses
دریاچه های داده
Data Lakes
دریاچه های داده در مقابل انبارهای داده
Data Lakes vs. Data Warehouses
چالش های معماری کنونی
Challenges of Current Architectures
پلت فرم Data Lakehouse
The Data Lakehouse Platform
مروری بر معماری سکوی Lakehouse
An Architectural Overview of the Lakehouse Platform
Databricks Data Lakehouse Platform: Architectural Review
Databricks Data Lakehouse Platform: Architectural Overview
Databricks Data Lakehouse Platform: ویژگی ها
Databricks Data Lakehouse Platform: Features
دریاچه دلتا و موتور دلتا
Delta Lake and Delta Engine
جداول دلتا
Delta Tables
استفاده از Lakehouse در Databricks
Using a Lakehouse on Databricks
پایگاه داده Databricks
The Databricks Data Platform
نسخه ی نمایشی: راه اندازی و کاوش در فضای کاری Databricks
Demo: Setting up and Exploring the Databricks Workspace
نسخه ی نمایشی: ایجاد یک خوشه و آپلود داده ها
Demo: Creating a Cluster and Uploading Data
نسخه ی نمایشی: ایجاد جداول دلتا با استفاده از Apache Spark
Demo: Creating Delta Tables Using Apache Spark
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات