آموزش اصول مهندسی داده (Data Engineering Essentials) - آخرین آپدیت

دانلود Data Engineering Essentials

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: این دوره شکاف میان داده‌های خام و سیستم‌های هوش مصنوعی آماده برای محیط عملیاتی (Production) را پر می‌کند. در سال ۲۰۲۶، ارزش یک مدل یادگیری ماشین با قابلیت اطمینان خط لوله‌های داده‌ای (Data Pipelines) که آن را تغذیه می‌کنند، تعریف می‌شود. این برنامه آموزشی شما را به یک مهندس آماده برای MLOps تبدیل می‌کند که قادر به ساخت معماری‌های داده‌ای خودکار، مقیاس‌پذیر و قابل مشاهده است. شما با تسلط بر چرخه حیات MLOps شروع خواهید کرد و خواهید آموخت که چرا DevOps سنتی برای چالش‌های منحصربه‌فرد داده‌ها و رانش مدل (Model Drift) کافی نیست. در بخش فنی، یاد می‌گیرید که چگونه خط لوله‌های ETL منعطف را با استفاده از ابزارهای مدرنی مانند Pandas و Polars برای مجموعه‌ داده‌های متوسط بسازید و سپس برای پردازش‌های توزیع‌شده به Apache Spark و Dask ارتقا یابید. این دوره تأکید ویژه‌ای بر استریمینگ آنی (Real-time Streaming) با Apache Kafka و پیاده‌سازی Feature Storeها برای حل مشکل چالش‌برانگیز «تفاوت آموزش و سرویس‌دهی» (Training-serving skew) دارد. در نهایت، همه این موارد را از طریق ارکستراسیون جریان کاری با استفاده از Airflow و Prefect به هم متصل می‌کنید تا اطمینان حاصل شود که جریان‌های داده شما نه تنها کاربردی، بلکه در سطح صنعتی، خودکار و کاملاً مانیتور شده هستند. برجستگی‌های دوره: - استک استاندارد صنعت: تجربه عملی با Kafka، Spark، Airflow و Feature Storeها. - تفکر اولویت‌محور تولید: تمرکز بر CI/CD/CT (آموزش مستمر) و حاکمیت داده (Data Governance). - آزمایشگاه‌های عملی: هر ماژول با یک پروژه عملی برای ساخت پورتفولیوی حرفه‌ای شما به پایان می‌رسد. - تمرکز بر مقیاس‌پذیری: انتقال از اسکریپت‌های محلی پایتون به معماری‌های توزیع‌شده در مقیاس ابری.

سرفصل ها و درس ها

مبانی MLOps MLOps Fundamentals

  • معرفی دوره Course Introduction

  • شروع به کار با تیم یادگیری ماشین Getting Started with Machine Learning Team

  • معرفی مهندس MLOps Introducing MLOps Engineer

  • مقایسه DevOps و MLOps DevOps and MLOps - A Comparison

  • چرخه حیات MLOps MLOps LifeCycle

  • یکپارچه‌سازی مستمر (CI) و استقرار مستمر (CD) Continuous Integration (CI), Continuous Deployment (CD)

  • آموزش مستمر (CT) و مانیتورینگ مستمر (CM) Continuous Training (CT), Continuous Monitoring (CM)

  • یافتن و بررسی ابزارهای مناسب DevOps برای MLOps - بخش اول Finding and Exploring Right Tools from DevOps for MLOps - Part 1

  • یافتن و بررسی ابزارهای مناسب DevOps برای MLOps - بخش دوم Finding and Exploring Right Tools from DevOps for MLOps - Part 2

  • معماری MLOps MLOps Architecture

پایه‌های داده و تبدیل داده‌ها Data Foundations & Transformation

  • جمع‌آوری و آماده‌سازی داده‌ها Data Collection and Preparation

  • جذب داده‌ها و ETL Data Ingestion - ETL

  • مفهوم دریاچه داده (Data Lake) Idea of Data Lake

  • پاک‌سازی و تبدیل داده‌ها Data Cleaning and Data Transformation

  • دموی اول: تبدیل مجموعه‌ داده‌های کوچک تا متوسط (Pandas, Polars) Demo 1: Small to Medium Datasets Transformation (Pandas, Polars)

  • دموی دوم: تبدیل مجموعه‌ داده‌های کوچک تا متوسط (Pandas, Polars) Demo 2: Small to Medium Datasets Transformation (Pandas, Polars)

  • دموی سوم: تبدیل مجموعه‌ داده‌های کوچک تا متوسط (Pandas, Polars) Demo 3: Small to Medium Datasets Transformation (Pandas, Polars)

داده‌های حجیم و استریمینگ برای یادگیری ماشین Big Data & Streaming for ML

  • داده‌های حجیم: Apache Spark (PySpark) و Dask Large Datasets: Apache Spark (PySpark), Dask

  • داده‌های استریمینگ: Apache Kafka و Apache Flink Streaming Datasets: Apache Kafka, Apache Flink

  • دموی اول: استریم داده‌ها با استفاده از Apache Kafka Demo 1: Stream Data using Apache Kafka

  • دموی دوم: استریم داده‌ها با استفاده از Apache Kafka Demo 2: Stream Data using Apache Kafka

  • دموی سوم: استریم داده‌ها با استفاده از Apache Kafka Demo 3: Stream Data using Apache Kafka

  • Feature Store چیست؟ What is Feature Store?

  • مزایای استفاده از Feature Store Benefits of using a Feature Store

ارکستراسیون جریان کاری MLOps MLOps Workflow Orchestration

  • ارکستراسیون خط لوله داده‌ها - Airflow و Prefect Data Pipeline Orchestration - Airflow, Prefect

  • دموی اول: ارکستراسیون خط لوله داده‌ها Demo 1: Data Pipeline Orchestration

  • دموی دوم: ارکستراسیون خط لوله داده‌ها Demo 2: Data Pipeline Orchestration

  • دموی سوم: استریم داده‌ها با استفاده از Apache Kafka Demo 3: Stream Data Using Apache Kafka

نمایش نظرات

آموزش اصول مهندسی داده (Data Engineering Essentials)
جزییات دوره
5h 27m
28
(آخرین آپدیت)
413
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده