لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش آپاچی ایرفلو 3: نویسندگی پیشرفته DAG
- آخرین آپدیت
دانلود Apache Airflow 3: Advanced DAG Authoring
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
با پیشرفتهترین قابلیتها، DAGهای ایرفلو خود را به سطح جدیدی ببرید.
طراحی DAGهای متمرکز بر دارایی (Asset-centric) با استفاده از Airflow 3.
پیادهسازی زمانبندی رویداد-محور (Event-driven) برای اجرای گردشکارهای مبتنی بر رویدادهای خارجی به جای زمانبندیهای ثابت.
ایجاد گردشکارهای پویا با استفاده از تکنیکهای پیشرفته Mapping برای مدیریت بهینه تعداد متغیر تسکها.
ساخت گردشکارهای هوش مصنوعی با آخرین بهروزرسانیهای ایرفلو با استفاده از دکوراتورها و اپراتورهای Human-in-the-loop.
پیشنیازها:
دانش کاربردی از Apache Airflow 2.x، شامل مفاهیم پایه نویسندگی و اجرای DAG.
تسلط بر برنامهنویسی پایتون (سطح متوسط).
تجربه کار با مفاهیم پایه ETL و خط لوله داده (Data Pipeline).
آشنایی با محیط خط فرمان (CLI) و دستورات پایه لینوکس/یونیکس.
درک مفاهیم پایه کانتینرسازی (Docker).
دسترسی به محیط توسعه قادر به اجرای Apache Airflow 3.x.
تجربه کار با سیستم کنترل نسخه Git (پایه).
ایرفلو 3: نویسندگی پیشرفته DAG
مهارتهای Apache Airflow خود را به سطح حرفهای برسانید. این دوره به بررسی عمیق ویژگیهای قدرتمند Airflow 3 میپردازد که مهندسان داده متخصص را از مبتدیان متمایز میکند.
شما بر TaskFlow API مسلط خواهید شد؛ از مفاهیم پایه تا الگوهای پیشرفته مانند تولید پویای DAG، گروههای تسک (Task Groups)، استخرها (Pools) و مدیریت منابع. بیاموزید چگونه با استفاده از Dynamic Task Mapping و تکنیکهای پیشرفتهای مانند reduce و expand، خط لولههای منعطف و مقیاسپذیر بسازید. استراتژیهای مدرن زمانبندی شامل Assets، زمانبندی شرطی و خط لولههای رویداد-محور با سرویسهایی مانند AWS SQS را کاوش کنید. علاوه بر این، نحوه ادغام هوش مصنوعی در گردشکارهای خود با استفاده از LLMها، AI SDK و الگوهای تایید انسانی (Human-in-the-loop) را کشف کنید.
آنچه خواهید آموخت:
نوشتن DAGهای تمیز و پایتونیک با استفاده از TaskFlow API
تولید پویای DAGها و بازاستفاده از تسکها مانند یک متخصص
تسلط بر Dynamic Task Mapping برای گردشکارهای منعطف و داده-محور
زمانبندی خط لولهها با استفاده از Assets، تریگرهای رویداد-محور و زمانبندی مستمر
ادغام مستقیم هوش مصنوعی و LLMها در تسکهای ایرفلو
پیادهسازی گردشکارهای Human-in-the-loop برای تاییدات هوش مصنوعی
هر ویدیو دارای کد منبع مربوط به خود است تا دنبال کردن مطالب برای شما آسان باشد.
این دوره برای چه کسانی است: مهندسان داده و توسعهدهندگانی که دانش پایهای از ایرفلو دارند و میخواهند با استفاده از آخرین ویژگیهای Airflow 3، DAGهایی کارآمدتر، قابل نگهداریتر و در سطح محیط عملیاتی (Production) بنویسند.
امیدوارم برای این دوره آماده باشید. بیایید شروع کنیم!
مارک لمبرتی
سرفصل ها و درس ها
مقدمه
Introduction
خوشآمدگویی!
Welcome!
من کی هستم؟
Who I am?
اهداف دوره
Course Goals
راه اندازی محیط توسعه ایرفلو
Setting Up Your Airflow Development Environment
ساخت DAG مانند یک حرفهای
Create DAGs like Pro
چرا برای ساخت DAG به Taskflow نیاز دارید؟
Why do you need creating DAGs with Taskflow
بازنویسی یک DAG قدیمی با Taskflow
Rewriting an old DAG with Taskflow
دسترسی به اطلاعات DAG و موارد دیگر از طریق تسکها
Access DAG information and more from your tasks
ارسال پارامترها به DAGها
Passing parameters to your DAGs
تولید پویای DAGها با تنظیمات مختلف
Dynamically generate DAGs with different settings
ترکیب دکوراتورها با اپراتورها
Mix decorators with operators
اپراتور Bash جدید (بسیار بهتر!)
The new bash operator (much better!)
گروهبندی تسکها با TaskGroups
Group your tasks with TaskGroups
آرگومانهای پیشفرض برای DAGها و Taskgroups
Default arguments to DAGs and Taskgroups
اجرای تسکها در ایرفلو نامحدود نیست
Running tasks on Airflow isn't unlimited
بازاستفاده از تسکها به صورت حرفهای
Reuse tasks like a pro
مدیریت صحیح منابع خارجی در DAGها
Correctly manage external resources within your DAGs
زمانبندی DAG مانند یک حرفهای
Schedule your DAGs like a Pro
روشهای مختلف زمانبندی DAGها
The different ways of scheduling DAGs
مبانی اما... حیاتی
The basics but... important
استفاده از Cron یا Timedelta؟
Cron or Timedelta?
آیا این استریمینگ است؟
Is that streaming?
زمانبندی DAGها بر اساس بهروزرسانی Asset
Scheduling DAGs on Asset updates
زمانبندی شرطی Asset
Conditional Asset scheduling
Assetها لزوماً نباید استاتیک باشند...
Assets don't have to be static...
دسترسی به متادیتاهای Asset
Access Asset metadata
روشی متفاوت (و بهتر؟) برای تعریف Assets
A different (better?) way to define Assets
زمانبندی DAGها بر اساس رویدادهای خارجی
Schedule your DAGs on EXTERNAL events
زمانبندی رویداد-محور با SQS
Event driven scheduling with SQS
ایجاد تسکهای پویا مانند یک حرفهای
Create dynamic tasks like a Pro
چرا تسکهای استاتیک کافی نیستند؟
Why static tasks is not enough
مبانی Dynamic Task Mapping
The basics of dynamic task mapping
دریافت خروجیها از تسکهای پویا
Fetch outputs from dynamic tasks
تغییر و فیلتر کردن خروجیهای تسکهای پویا
Transform and filter dynamic task outputs
مپ کردن تسکها روی دیکشنریها
Mapping tasks on dictionaries
نمایش نظرات