آموزش شروع کار با پلتفرم Databricks Lakehouse

Getting Started with the Databricks Lakehouse Platform

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: این دوره آموزشی به شما می آموزد که چگونه معماری Data Lakehouse بهترین ها را از هر دو نوع Data Lakes و Data Warehouse به شما می دهد و به شما امکان می دهد نیازهای داده خود را برای پردازش کلان داده، تجزیه و تحلیل SQL و یادگیری ماشین در یک پلت فرم واحد برآورده کنید. سازمان ها مدت هاست که داده ها را در یک پلت فرم جمع آوری کرده اند. انواع فرمت ها، داده های ساخت یافته، بدون ساختار و نیمه ساختار یافته. با این حال، کار با داده‌ها در قالب‌های مختلف برای موارد استفاده مختلف، به انبارهای داده پلت‌فرم متعدد برای داده‌های ساختاریافته مورد نیاز برای هوش تجاری و دریاچه‌های داده برای داده‌های بدون ساختار مورد نیاز برای علم داده و یادگیری ماشین نیاز دارد. معماری دریاچه داده Databricks یک پارادایم نوآورانه است که انعطاف پذیری و کارایی یک دریاچه داده را با قابلیت اطمینان و ویژگی های یک انبار داده ترکیب می کند. در این دوره آموزشی، شروع به کار با پلتفرم Databricks Lakehouse، با اهمیت ذخیره سازی داده ها در یک مخزن متمرکز و اینکه چگونه دریاچه های داده و انبارهای داده برای حل مشکلات مختلف مربوط به داده ها خدمت می کنند، آشنا خواهید شد. ابتدا، انواع فن‌آوری‌ها را در فضای تحلیلی و اینکه چگونه پلتفرم lakehouse نقاط قوت آن‌ها را در بر می‌گیرد و محدودیت‌های آن‌ها را کاهش می‌دهد، کشف خواهید کرد. در مرحله بعد، اجزای اساسی تشکیل دهنده معماری یک خانه دریاچه داده و اینکه چگونه پلتفرم Databricks Lakehouse از Delta Lakes برای فعال کردن تجزیه و تحلیل SQL و علم داده و یادگیری ماشین با استفاده از ذخیره سازی دریاچه داده های زیرین استفاده می کند، خواهید فهمید. در نهایت، Databricks Data Lakehouse را در Microsoft Azure بررسی خواهید کرد. شما Lakehouse داده را می سازید، داده ها را در جداول دلتا ذخیره می کنید و با استفاده از Apache Spark و پرس و جوهای SQL به همان داده ها دسترسی خواهید داشت. پس از اتمام این دوره، می‌توانید به وضوح بیان کنید که چگونه پلت فرم داده lakehouse به کاهش چالش‌ها با معماری داده‌های فعلی کمک می‌کند و به طور عملی می‌دانید که چگونه می‌توانید lakehouse را در Databricks راه‌اندازی و استفاده کنید.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

معرفی پلتفرم Lakehouse Introducing the Lakehouse Platform

  • پیش نیازها و رئوس مطالب دوره Prerequisites and Course Outline

  • اطلاعات بزرگ Big Data

  • سیلوهای داده Data Silos

  • انبارهای داده Data Warehouses

  • دریاچه های داده Data Lakes

  • دریاچه های داده در مقابل انبارهای داده Data Lakes vs. Data Warehouses

  • چالش های معماری کنونی Challenges of Current Architectures

  • پلت فرم Data Lakehouse The Data Lakehouse Platform

مروری بر معماری سکوی Lakehouse An Architectural Overview of the Lakehouse Platform

  • Databricks Data Lakehouse Platform: Architectural Review Databricks Data Lakehouse Platform: Architectural Overview

  • Databricks Data Lakehouse Platform: ویژگی ها Databricks Data Lakehouse Platform: Features

  • دریاچه دلتا و موتور دلتا Delta Lake and Delta Engine

  • جداول دلتا Delta Tables

استفاده از Lakehouse در Databricks Using a Lakehouse on Databricks

  • پایگاه داده Databricks The Databricks Data Platform

  • نسخه ی نمایشی: راه اندازی و کاوش در فضای کاری Databricks Demo: Setting up and Exploring the Databricks Workspace

  • نسخه ی نمایشی: ایجاد یک خوشه و آپلود داده ها Demo: Creating a Cluster and Uploading Data

  • نسخه ی نمایشی: ایجاد جداول دلتا با استفاده از Apache Spark Demo: Creating Delta Tables Using Apache Spark

  • نسخه ی نمایشی: کاوش جداول دلتا Demo: Exploring Delta Tables

  • نسخه ی نمایشی: پردازش داده ها با Apache Spark Demo: Processing Data with Apache Spark

  • نسخه ی نمایشی: پیکربندی و راه اندازی انبار SQL Demo: Configuring and Starting a SQL Warehouse

  • نسخه ی نمایشی: اجرای پرس و جوهای SQL در جداول دلتا Demo: Running SQL Queries on Delta Tables

  • نسخه ی نمایشی: تجسم داده ها با استفاده از Databricks SQL Demo: Visualizing Data Using Databricks SQL

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش شروع کار با پلتفرم Databricks Lakehouse
جزییات دوره
1h 38m
23
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.