لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مدیریت جریانهای کاری مهندسی داده با Apache Airflow
- آخرین آپدیت
دانلود Data Engineering Workflow Orchestration with Airflow
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
پلتفرمهای داده مدرن برای جابجایی و پردازش دادهها در مقیاس بزرگ، به جریانهای کاری (Workflows) خودکار و قابل اعتماد متکی هستند. دوره مدیریت جریانهای کاری مهندسی داده با Apache Airflow، شما را با مهارتهای لازم برای طراحی، ساخت، نظارت و استقرار خطوط لوله داده (Data Pipelines) در سطح عملیاتی و تجاری آشنا میکند. با تغییر رویکرد سازمانها به سمت سیستمهای داده مقیاسپذیر و مقاوم در برابر خطا، تسلط بر ارکستراسیون جریانهای کاری برای مهندسان داده و توسعهدهندگان بکاند ضروری شده است.
شما در این دوره از طریق دروس ساختاریافته و آموزشهای عملی، خواهید آموخت که Apache Airflow چگونه جریانهای کاری را در سیستمهای توزیعشده زمانبندی، اجرا و نظارت میکند. سرفصلهای این دوره شامل معماری جریان کاری، زمانبندی تسکها، اپراتورها، سنسورها، API TaskFlow، طراحی خط لوله داده، مانیتورینگ، تلاش مجدد (Retries)، لاگگیری، دیباگینگ، جریانهای کاری پویا، بهینهسازی عملکرد و متدهای استقرار در محیط عملیاتی بر پایه CI/CD است.
در پایان این دوره شما قادر خواهید بود:
• خطوط لوله داده مقیاسپذیر را با استفاده از Apache Airflow طراحی و پیادهسازی کنید.
• ارکستراسیون جریانهای کاری را با استفاده از اپراتورها، سنسورها و وابستگیهای تسکها اجرا کنید.
• خطوط لوله را با استفاده از لاگها، سیستمهای تلاش مجدد و کنترلهای عملکردی، نظارت، عیبیابی و بهینه کنید.
• جریانهای کاری آماده تولید را با کنترل نسخه و یکپارچهسازی CI/CD مستقر و مدیریت کنید.
• بهترین متدهای قابلیت اطمینان و کیفیت داده را در محیطهای واقعی به کار ببرید.
این دوره برای مهندسان داده آینده، توسعهدهندگان بکاند، متخصصان DevOps، مهندسان تحلیل داده و مهندسان نرمافزار که به دنبال تقویت مهارتهای خود در اتوماسیون جریان کاری و مدیریت دادههای عملیاتی هستند، ایدهآل است.
داشتن درک پایه از برنامهنویسی پایتون، پایگاه دادهها و مفاهیم داده توصیه میشود، هرچند تجربه قبلی با Apache Airflow الزامی نیست.
با ما همراه شوید تا در ارکستراسیون جریانهای کاری استاد شوید و سیستمهای دادهای قابل اعتماد و در سطح صنعتی را با اطمینان بسازید.
سرفصل ها و درس ها
مبانی ارکستراسیون جریان کاری و Apache Airflow
Foundations of Workflow Orchestration and Apache Airflow
معرفی دوره
Course Introduction
مفاهیم خطوط لوله مهندسی داده و ETL/ELT
Data Engineering Pipelines and ETL/ELT Concepts
چرا ارکستراسیون جریان کاری در مهندسی داده اهمیت دارد
Why Workflow Orchestration Matters in Data Engineering
تمرین عملی: ساخت خط لوله داده ساده بدون ارکستراسیون
Hands On: Simple Data Pipeline Without Orchestration
آپاچی ایرفلو چیست؟ موارد کاربرد و اکوسیستم
What is Apache Airflow Use Cases and Ecosystem
معماری Airflow
Airflow Architecture
مفاهیم کلیدی – DAGها
Core Concepts – DAGs
تمرین عملی: نصب Airflow و بررسی رابط کاربری وب
Hands On: Installing Airflow and Exploring the Web UI
ساختار DAG، زمانبندی و بهترین متدها
DAG Structure, Scheduling and Best Practices
تمرین عملی: نوشتن و اجرای یک DAG ساده
Hands On: Writing and Running a Basic DAG
تمرین عملی: وابستگیها، زمانبندی و اجرای دستی در مقابل زمانبندی شده
Hands On: Dependencies, Scheduling and Manual vs Scheduled Runs
ساخت خطوط لوله داده قابل اعتماد با Airflow
Building Reliable Data Pipelines with Airflow
اپراتورها، هوکها و سنسورها
Operators, Hooks and Sensors
رابط TaskFlow API و XComs
TaskFlow API and XComs
تمرین عملی: تسکهای ETL با استفاده از PythonOperator و TaskFlow API
Hands On: ETL Tasks Using PythonOperator and TaskFlow API
تمرین عملی: استفاده از سنسورها برای انتظار دادههای خارجی
Hands On: Sensors Waiting for External Data
طراحی خطوط لوله ETL در مقابل ELT
Designing ETL vs ELT Pipelines
متغیرها، اتصالات و خطوط لوله پارامتری
Variables, Connections and Parameterized Pipelines
تمرین عملی: ساخت یک خط لوله ETL کامل (End-to-End)
Hands On: Building an End-to-End ETL Pipeline
تمرین عملی: زمانبندی و پیکربندی با استفاده از متغیرها
Hands On: Scheduling and Configuration Using Variables
تلاش مجدد، SLAها، هشدارها و لاگگیری
Retries, SLAs, Alerts and Logging
تکرارپذیری (Idempotency) و سازگاری دادهها در خطوط لوله
Idempotency and Data Consistency in Pipelines
تمرین عملی: مدیریت خطاها و تلاشهای مجدد
Hands On: Handling Failures and Retries
تمرین عملی: عیبیابی تسکهای شکستخورده با استفاده از لاگها و UI
Hands On: Debugging Failed Tasks Using Logs and UI
طراحی پیشرفته DAG و Airflow در سطح عملیاتی
Advanced DAG Design and Production-Grade Airflow
موازیسازی، همزمانی، Poolها و Executorها
Parallelism, Concurrency, Pools and Executors
Backfilling، Catchup و بهینهسازی عملکرد
Backfilling, Catchup and Performance Optimization
تمرین عملی: مدیریت تسکهای موازی و Backfillها
Hands On: Managing Parallel Tasks and Backfills
DAGهای پویا، شاخهبندی و قوانین Trigger
Dynamic DAGs, Branching and Trigger Rules
تمرین عملی: تولید پویا تسکها
Hands On: Dynamic Task Generation
نمایش نظرات