آموزش Spark، Hadoop و Snowflake برای مهندسی داده - آخرین آپدیت

دانلود Spark, Hadoop, and Snowflake for Data Engineering

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مهارت‌های لازم برای ساخت خط لوله‌های داده (Data Pipelines) کارآمد و مقیاس‌پذیر را کسب کنید. در این دوره، پلتفرم‌های ضروری مهندسی داده شامل Hadoop، Spark و Snowflake را بررسی کرده و نحوه بهینه‌سازی و مدیریت آن‌ها را می‌آموزید. همچنین به بررسی Databricks، پلتفرمی قدرتمند برای تحلیل داده‌ها و یادگیری ماشین می‌پردازیم و مهارت‌های علم داده با پایتون را از طریق PySpark تقویت می‌کنیم. در نهایت، مفاهیم کلیدی MLflow را به عنوان یک پلتفرم متن‌باز برای مدیریت چرخه حیات یادگیری ماشین یاد گرفته و نحوه ادغام آن با Databricks را خواهید آموخت. این دوره برای افرادی طراحی شده است که قصد دارند مسیر شغلی خود را در زمینه علم داده یا مهندسی داده آغاز کرده یا ارتقا دهند، و همچنین برای توسعه‌دهندگان نرم‌افزار و مهندسانی که می‌خواهند مجموعه‌ مهارت‌های مدیریت داده خود را گسترش دهند. علاوه بر تکنولوژی‌ها، شما متدولوژی‌های مدیریت پروژه و جریان کاری مهندسی داده، از جمله متدهای Kaizen، DevOps و DataOps را فرا خواهید گرفت. این دوره جامع با آزمون‌های ارزیابی در هر بخش، شما را در مسیر تبدیل شدن به یک مهندس داده حرفه‌ای و آماده برای مواجهه با چالش‌های دنیای داده‌محور امروز هدایت می‌کند.

سرفصل ها و درس ها

مرور کلی و آشنایی با PySpark Overview and Introduction to PySpark

  • آشنایی با مدرس دوره: کندی برمن Meet your Co-Instructor: Kennedy Behrman

  • آشنایی با مدرس دوره: نوآ گیفت Meet your Co-Instructor: Noah Gift

  • مرور کلی پلتفرم‌های کلان‌داده (Big Data) Overview of Big Data Platforms

  • شروع کار با Hadoop Getting Started with Hadoop

  • شروع کار با Spark Getting Started with Spark

  • مقدمه‌ای بر مجموعه‌های داده توزیع‌شده تاب‌آور (RDD) Introduction to Resilient Distributed Datasets (RDD)

  • دموی مجموعه‌های داده توزیع‌شده تاب‌آور (RDD) Resilient Distributed Datasets (RDD) Demo

  • مقدمه‌ای بر Spark SQL Introduction to Spark SQL

  • دموی دیتای‌فریم PySpark: بخش اول PySpark Dataframe Demo: Part 1

  • دموی دیتای‌فریم PySpark: بخش دوم PySpark Dataframe Demo: Part 2

اسنو-فلیک (Snowflake) Snowflake

  • اسنو-فلیک (Snowflake) چیست؟ What is Snowflake?

  • لایه‌های Snowflake Snowflake Layers

  • رابط کاربری وب Snowflake Snowflake Web UI

  • کار با محیط Snowflake Navigating Snowflake

  • ایجاد جدول در Snowflake Creating a Table in Snowflake

  • انبار‌های (Warehouses) اسنو-فلیک Snowflake Warehouses

  • نوشتن داده‌ها در Snowflake Writing to Snowflake

  • خواندن داده‌ها از Snowflake Reading from Snowflake

Azure Databricks و MLFlow Azure Databricks and MLFLow

  • دسترسی به Databricks Accessing Databricks

  • استفاده از نوت‌بوک‌های Spark در Databricks Spark Notebooks with Databricks

  • کار با داده‌ها در Databricks Using Data with Databricks

  • کار با محیط‌های کاری (Workspaces) در Databricks Working with Workspaces in Databricks

  • قابلیت‌های پیشرفته Databricks Advanced Capabilities of Databricks

  • مقدمه‌ای بر PySpark در Databricks PySpark Introduction on Databricks

  • بررسی ویژگی‌های Databricks Azure Exploring Databricks Azure Features

  • استفاده از DBFS تا جریان کاری AutoML Using the DBFS to AutoML Workflow

  • بارگذاری، ثبت و استقرار مدل‌های ML Load, Register and Deploy ML Models

  • ثبت مدل در Databricks (Model Registry) Databricks Model Registry

  • ارائه مدل (Model Serving) در Databricks Model Serving on Databricks

  • MLOps چیست؟ What is MLOps?

  • بررسی فریم‌ورک‌های متن‌باز MLFlow Exploring Open-Source MLFlow Frameworks

  • اجرای MLFlow با Databricks Running MLFlow with Databricks

  • پیاده‌سازی کامل Databricks MLFlow End to End Databricks MLFlow

  • ثبت خودکار (Autologging) در Databricks با MLFlow Databricks Autologging with MLFlow

متدولوژی‌های DataOps و عملیات DataOps and Operations Methodologies

  • متدولوژی Kaizen برای داده‌ها Kaizen Methodology for Data

  • آشنایی با GitHub CodeSpaces Introducing GitHub CodeSpaces

  • کامپایل پایتون در GitHub Codespaces Compiling Python in GitHub Codespaces

  • بررسی Sagemaker Studio Lab Walking through Sagemaker Studio Lab

  • کلاس جامع Pytest (اختیاری) Pytest Master Class (Optional)

  • DevOps چیست؟ What is DevOps?

  • مفاهیم کلیدی DevOps DevOps Key Concepts

  • مرور کلی یکپارچه‌سازی مستمر (CI) Continuous Integration Overview

  • ساخت یک مدل NLP در Cloud9 با پایتون Build an NLP in Cloud9 with Python

  • ساخت یک میکروسرویس FastAPI کانتینری با استقرار مستمر Build a Continuously Deployed Containerized FastAPI Microservice

  • استقرار مستمر Hugo در AWS Hugo Continuous Deploy on AWS

  • تحویل مستمر مبتنی بر کانتینر Container Based Continuous Delivery

  • DataOps چیست؟ What is DataOps?

  • استفاده از DataOps و MLOps در Snowflake DataOps and MLOps with Snowflake

  • ساخت خط لوله‌های ابری با Step Functions و Lambda Building Cloud Pipelines with Step Functions and Lambda

  • دریاچه داده (Data Lake) چیست؟ What is a Data Lake?

  • مقایسه انبار داده (Data Warehouse) و Feature Store Data Warehouse vs. Feature Store

  • چالش‌های کلان‌داده (Big Data) Big Data Challenges

  • انواع پردازش کلان‌داده Types of Big Data Processing

  • خط لوله مهندسی داده در دنیای واقعی Real-World Data Engineering Pipeline

  • حلقه بازخورد داده‌ها (Data Feedback Loop) Data Feedback Loop

نمایش نظرات

آموزش Spark، Hadoop و Snowflake برای مهندسی داده
جزییات دوره
29h 55m
55
(آخرین آپدیت)
14,614
3.9 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده

Noah Gift Noah Gift

کارشناس MLOps | انفرادی | نویسنده | استادیار | CTO

Noah Gift بنیانگذار Pragmatic A.I است. آزمایشگاه ها و یکی از همکاران بنیاد نرم افزار پایتون.

نوح به طور گسترده با AWS کار می کند و یک قهرمان یادگیری ماشین AWS است. او دارای چندین گواهینامه صنعتی برای AWS است. نوح آموزش و طراحی دوره های آموزشی ماشین فارغ التحصیل، MLOps، A.I.، علم داده و مشاوره در زمینه یادگیری ماشین و معماری ابری را انجام می دهد. مسئولیت های او شامل رهبری ابتکار صدور گواهینامه چند ابری برای دانش آموزان است. نوح نقش های مختلفی را به صورت حرفه ای ایفا کرده است، از جمله CTO، مدیر کل، مشاور مدیر ارشد فناوری، مشاور ارشد دانشمند داده و معمار ابر. او همچنین دارای چندین تیتراژ فیلم در فیلم‌های اصلی برای کارهای فنی از جمله آواتار، مرد عنکبوتی 3 و بازگشت سوپرمن است.