آموزش استقرار و نگهداری سیستم‌های هوش مصنوعی در محیط عملیاتی (Production) - آخرین آپدیت

دانلود Deploying and Maintaining Production AI Systems

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: بسیاری از مدل‌های یادگیری ماشین در محیط عملیاتی شکست می‌خورند، نه به دلیل الگوریتم‌های ضعیف، بلکه به دلیل روش‌های استقرار نامناسب، عدم نظارت بر افت عملکرد (Performance Drift) و فقدان تدابیر عملیاتی حفاظتی. این دوره شما را به مهارت‌های MLOps و مهندسی قابلیت اطمینان سایت (SRE) مجهز می‌کند تا سیستم‌های هوش مصنوعی مولد را به‌صورت ایمن مستقر کنید، مدیریت چرخه حیات مدل را خودکار سازید و حداکثر عملکرد را در محیط‌های عملیاتی حفظ کنید. شما یاد خواهید گرفت که جریان‌های کاری استقرار را با استفاده از نسخه‌های Canary و بازگشت‌های خودکار (Rollbacks) سازماندهی کنید، خط لوله‌های CI/CD را با بررسی‌های انطباق و بازآموزی‌های تحریک‌شده توسط Drift پیاده‌سازی نمایید و سیستم‌های مشاهده‌پذیری (Observability) را با استفاده از لاگ‌ها، متریک‌ها و ردیابی (Tracing) طراحی کنید. از طریق پروژه‌های عملی، داشبورد‌های عملکردی خواهید ساخت که تجربه کاربر را به KPIهای عملیاتی متصل می‌کند و خط لوله‌های اتوماسیونی ایجاد می‌کنید که قابلیت اطمینان را بدون کاهش سرعت افزایش می‌دهد. این مهارت‌های کاربردی شما را برای نقش‌هایی مانند مهندس MLOps، متخصص استقرار AI و مهندس قابلیت اطمینان سایت (SRE) آماده می‌کند. در پایان این دوره، شما قادر خواهید بود تصمیمات انتشار را بر اساس داده‌ها بگیرید، زمان خرابی (Downtime) را از طریق نظارت پیش‌دستانه کاهش دهید و روش‌های عملیاتی قدرتمندی را برای سیستم‌های هوش مصنوعی در مقیاس بزرگ پیاده‌سازی کنید.

سرفصل ها و درس ها

جلوگیری از شکست‌های استقرار از طریق تحلیل وابستگی Preventing Deployment Failures Through Dependency Analysis

  • چرا تحلیل وابستگی باعث نجات استقرار در محیط عملیاتی می‌شود Why Dependency Analysis Saves Production Deployments

  • درک وابستگی‌های کانتینر و تداخل‌های نسخه‌ها Understanding Container Dependencies and Version Conflicts

  • تحلیل Dockerfileها و گزارش‌های SBOM برای تداخل وابستگی‌ها Analyzing Dockerfiles and SBOM Reports for Dependency Conflicts

بهینه‌سازی استقرار از طریق تحلیل عملکرد Optimizing Deployment Through Performance Analysis

  • چرا انتخاب هدف استقرار تعیین‌کننده موفقیت سیستم AI است Why Deployment Target Selection Determines AI System Success

  • متریک‌های عملکرد و تحلیل هزینه برای اهداف استقرار Performance Metrics and Cost Analysis for Deployment Targets

  • بنچ‌مارک مدل‌های AI در اهداف مختلف استقرار Benchmarking AI Models Across Deployment Targets

پیاده‌سازی استراتژی‌های استقرار بدون توقف (Zero Downtime) Implementing Zero-Downtime Deployment Strategies

  • چرا استقرار بدون توقف برای هوش مصنوعی عملیاتی غیرقابل مذاکره است Why Zero-Downtime Deployments Are Non-Negotiable for Production AI

  • معماری استقرار Blue-Green و پروتکل‌های هماهنگی Blue-Green Deployment Architecture and Coordination Protocols

  • استقرار مدل‌های ML با استراتژی Blue-Green در کوبرنتیز Deploying ML Models with Blue-Green Strategy in Kubernetes

مبانی تحلیل مانیفست استقرار Deployment Manifest Analysis - Foundation

  • چرا تحلیل سازگاری استقرار از فجایع محیط عملیاتی جلوگیری می‌کند Why Deployment Compatibility Analysis Prevents Production Disasters

  • حل وابستگی‌ها و ماتریس‌های سازگاری Dependency Resolution and Compatibility Matrices

  • بررسی مانیفست استقرار GenAI: تحلیل گام‌به‌گام سازگاری Inspecting a GenAI Deployment Manifest: Step-by-Step Compatibility Analysis

ارزیابی آمادگی انتشار در اپلیکیشن‌های اصلی Release Readiness Evaluation - Core Application

  • چرا تصمیمات انتشار داده‌محور از ضرر مالی جلوگیری می‌کند Why Data-Driven Release Decisions Prevent Revenue Loss

  • خواندن نشانه‌ها: تفسیر داشبوردهای عملکرد GenAI برای تصمیمات انتشار Reading the Signs: Interpreting GenAI Performance Dashboards for Release Decisions

  • تحلیل تصمیم Go/No-Go: فرآیند گام‌به‌گام ارزیابی داشبورد Go/No-Go Decision Analysis: Step-by-Step Dashboard Evaluation Process

ایجاد جریان‌های کاری سازمان‌یافته در یکپارچه‌سازی و ارزیابی Orchestrated Workflow Creation - Integration & Assessment

  • چرا جریان‌های کاری سازمان‌یافته از شکست‌های میلیون دلاری جلوگیری می‌کند Why Orchestrated Deployment Workflows Prevent Million-Dollar Failures

  • پیاده‌سازی استقرارهای ایمن: الگوهای Canary و تحویل پیش‌رونده برای GenAI Implementing Safe Deployments: Canary Patterns and Progressive Delivery for GenAI

  • ساخت یک خط لوله کامل استقرار GenAI: از کد تا محیط عملیاتی Building a Complete GenAI Deployment Pipeline: From Code to Production

تحلیل گلوگاه‌های عملکرد خط لوله (Pipeline) Analyze Pipeline Performance Bottlenecks

  • چرا تشخیص عملکرد، MLOps قابل اطمینان را از MLOps شکننده جدا می‌کند Why Performance Diagnosis Separates Reliable from Fragile MLOps

  • کار با لاگ‌های MLflow برای شناسایی الگوهای عملکرد Navigating MLflow Logs to Identify Performance Patterns

  • تحلیل سیستماتیک مراحل Spark برای شناسایی گلوگاه‌ها Systematic Spark Stage Analysis for Bottleneck Detection

ارزیابی انطباق CI/CD و ایمنی بازگشت (Rollback) Evaluate CI/CD Compliance and Rollback Safety

  • چرا انطباق با حاکمیت AI، MLOps پایدار را از MLOps شکننده جدا می‌کند Why AI Governance Compliance Separates Sustainable from Fragile MLOps

  • چارچوب‌های حاکمیت هوش مصنوعی مسئولانه و اصول یکپارچه‌سازی CI/CD Responsible AI Governance Frameworks and CI/CD Integration Principles

  • ارزیابی سیستماتیک جریان کاری GitHub Actions برای انطباق با حاکمیت AI Systematic GitHub Actions Workflow Evaluation for AI Governance Compliance

ایجاد خط لوله‌های بازآموزی خودکار Create Automated Retraining Pipelines

  • چرا اتوماسیون هوشمند، سیستم‌های ML تطبیق‌پذیر را از سیستم‌های شکننده جدا می‌کند Why Intelligent Automation Separates Adaptive from Fragile ML Systems

  • روش‌های شناسایی Drift داده‌ها و معماری تحریک خودکار (Trigger) Data Drift Detection Methods and Automated Trigger Architecture

  • ساخت سیستم‌های شناسایی Drift مدل PSI آماده برای محیط عملیاتی Building Production-Ready PSI Drift Detection Systems

بهینه‌سازی آستانه هشدارها Alert Threshold Optimization

  • هزینه خستگی ناشی از هشدارها (Alert Fatigue) در عملیات GenAI The Cost of Alert Fatigue in GenAI Operations

  • مبانی ارزیابی آستانه هشدار Alert Threshold Evaluation Fundamentals

  • تحلیل داده‌های تاریخی هشدارها برای بهینه‌سازی آستانه Analyzing Historical Alert Data for Threshold Optimization

ساخت داشبورد عملکرد Performance Dashboard Creation

  • داستان‌های موفقیت داشبوردهای مدیریتی Executive Dashboard Success Stories

  • طراحی داشبورد برای سیستم‌های GenAI Dashboard Design for GenAI Systems

  • ساخت داشبوردهای OpenTelemetry Building OpenTelemetry Dashboards

ارزیابی مشاهده‌پذیری سیستم System Observability Assessment

  • داستان موفقیت سه ستون مشاهده‌پذیری Three Pillars Success Story

  • مبانی مشاهده‌پذیری (Observability) Observability Fundamentals

  • تحلیل ردیابی توزیع‌شده (Distributed Trace) برای عیب‌یابی سیستم‌های GenAI Distributed Trace analysis for GenAI system troubleshooting

پروژه: استقرار و نگهداری سیستم‌های هوش مصنوعی در محیط عملیاتی Project: Deploying and Maintaining Production AI Systems

  • استقرار و عملیات هوش مصنوعی AI Deployment and Operations

نمایش نظرات

آموزش استقرار و نگهداری سیستم‌های هوش مصنوعی در محیط عملیاتی (Production)
جزییات دوره
12h 56m
37
(آخرین آپدیت)
104
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده