آموزش ابزارهای مدیریت داده در Databricks

Data Management Tools on Databricks

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: این دوره به شما برخی از تکنیک‌های اساسی برای ذخیره، مدیریت و پردازش داده‌ها با استفاده از پلتفرم Databricks را آموزش می‌دهد. داده‌ها در قلب Databricks قرار دارند و مدیریت آن‌ها به شیوه‌ای بهینه برای هر کاربری در این پلتفرم یک مهارت حیاتی است. در این دوره آموزشی، ابزارهای مدیریت داده در Databricks، بارگیری، پیکربندی و دسترسی به داده ها را با استفاده از UI، کتابخانه dbutils و یک برنامه Spark یاد خواهید گرفت. ابتدا، سیستم فایل Databricks (DBFS)، نحوه پیاده سازی آن به عنوان یک لایه در بالای ذخیره سازی اشیاء، و نحوه دسترسی به آن با استفاده از رابط کاربری وب Databricks و Databricks API را بررسی خواهید کرد. همچنین استفاده از کتابخانه dbutils را بررسی خواهید کرد، از کاربرد آن در عملیات سیستم فایل گرفته تا تنظیم ویجت ها در یک نوت بوک. در مرحله بعد، با ایجاد و سپس استفاده از جداول مدیریت شده (Delta) و جداول خارجی و مشاهده ویژگی های موجود برای هر یک، شباهت آنها و تفاوت آنها با یکدیگر، به مدیریت داده های ساخت یافته در Databricks می پردازید. در نهایت، توجه خود را به مصرف و تجزیه و تحلیل داده ها از یک برنامه Spark که با استفاده از یک نوت بوک ساخته شده است معطوف خواهید کرد و به معیارها و نمودارهایی که برای ردیابی اجراها و منابع در Databricks در دسترس هستند نگاهی اجمالی خواهید داشت. پس از اتمام این دوره، دانش و مهارت های لازم را در مدیریت و پردازش داده ها در Databricks به دست خواهید آورد تا به شما کمک کند تا داده ها را به شیوه ای ایمن و کارآمد در این پلتفرم ذخیره کرده و به آن دسترسی داشته باشید.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

کار با سیستم فایل Databricks Working with the Databricks File System

  • پیش نیازهای دوره و طرح کلی Course Prerequisites and Outline

  • سیستم فایل Databricks The Databricks File System

  • نسخه ی نمایشی: راه اندازی یک فضای کاری Databricks Demo: Setting up a Databricks Workspace

  • مقدمه ای بر dbutils An Introduction to dbutils

  • نسخه ی نمایشی: آپلود یک فایل در DBFS Demo: Uploading a File to DBFS

  • نسخه ی نمایشی: ایجاد یک نوت بوک Demo: Creating a Notebook

  • نسخه ی نمایشی: کاوش در کتابخانه dbutils Demo: Exploring the dbutils Library

  • نسخه ی نمایشی: انجام عملیات سیستم فایل با dbutils Demo: Performing File System Operations with dbutils

  • نسخه ی نمایشی: استفاده از Widgets API در dbutils Demo: Using the Widgets API in dbutils

ایجاد و مدیریت پایگاه های داده و جداول Creating and Managing Databases and Tables

  • ذخیره سازی داده های ساخت یافته Storing Structured Data

  • نسخه ی نمایشی: ایجاد یک پایگاه داده و یک جدول دلتا Demo: Creating a Database and a Delta Table

  • نسخه ی نمایشی: کار با جداول دلتا Demo: Working with Delta Tables

  • نسخه ی نمایشی: کار با جداول خارجی Demo: Working with External Tables

  • نسخه ی نمایشی: جداول پارتیشن بندی Demo: Partitioning Tables

پردازش داده ها با آپاچی اسپارک Processing Data with Apache Spark

  • پردازش داده ها با آپاچی اسپارک Processing Data with Apache Spark

  • نسخه ی نمایشی: تجزیه و تحلیل داده ها با Apache Spark Demo: Analyzing Data with Apache Spark

  • نسخه ی نمایشی: دسترسی به جزئیات شغل Demo: Accessing Job Details

  • نسخه ی نمایشی: دسترسی به گزارش های خوشه Demo: Accessing Cluster Logs

  • خلاصه دوره و مطالب مرتبط Course Summary and Related Content

نمایش نظرات

نظری ارسال نشده است.

آموزش ابزارهای مدیریت داده در Databricks
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
1h 25m
20
Pluralsight (پلورال سایت) pluralsight-small
08 شهریور 1401 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
از 5
دارد
دارد
دارد
Kishan Iyer

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kishan Iyer Kishan Iyer

مهندس محتوا، کارشناس DevOps، و کاربر Power Platform Google Cloud

Kishan Iyer یک مهندس محتوا، متخصص DevOps و کاربر Power Platform Google Cloud است.

Kishan دارای بیش از 20 سال تجربه توسعه نرم افزار در مقیاس جهانی. در طول دوران حرفه‌ای خود، او در نقش‌های فنی بسیار متنوعی در Deutsche Bank، Electric Cloud، WebMD و جاهای دیگر کار کرده است. او دارای مدرک کارشناسی ارشد علوم کامپیوتر از دانشکده مهندسی و علوم کاربردی فو بنیاد فو در دانشگاه کلمبیا در نیویورک است. کیشان متخصص در متدولوژی‌های توسعه چابک، SQL و سرویس‌های داده پلتفرم ابری گوگل، در حال حاضر به عنوان مهندس محتوا در Loonycorn، یک شرکت آموزش الکترونیکی و تولید ویدیو مستقر در بنگالورو، کارناتاکا، هند کار می‌کند.

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.