دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش مهندسی مشاهده‌پذیری (Observability): متریک‌ها، لاگ‌ها و تریس‌ها - آخرین آپدیت

دانلود Observability Engineering: Metrics, Logs, and Traces

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: این برنامه آموزشی بررسی می‌کند که چگونه مشاهده‌پذیری (Observability) مهندسان را قادر می‌سازد تا سیستم‌های توزیع‌شده مدرن را با استفاده از متریک‌ها، لاگ‌ها و تریس‌ها درک، مانیتور و عیب‌یابی کنند. شما با یادگیری اصول بنیادی مشاهده‌پذیری شروع خواهید کرد، تفاوت آن را با مانیتورینگ سنتی درک می‌کنید و سه ستون اصلی مشاهده‌پذیری را بررسی خواهید کرد. از طریق دموهای عملی با Prometheus و Node Exporter، یاد می‌گیرید که تله‌متری سیستم چگونه جمع‌آوری می‌شود و متریک‌ها چگونه دید کافی نسبت به زیرساخت و رفتار اپلیکیشن ایجاد می‌کنند. سپس استراتژی‌های متریک با تمرکز بر قابلیت اطمینان را با استفاده از مفاهیمی مانند Golden Signals، شاخص‌های سطح سرویس (SLIs)، اهداف سطح سرویس (SLOs) و بودجه‌های خطا (Error Budgets) طراحی خواهید کرد. نمایش‌های عملی نشان می‌دهند که چگونه متریک‌های اپلیکیشن را جمع‌آوری کنید، کوئری‌های PromQL بنویسید و الگوهای تأخیر و خطا را تحلیل کنید. همچنین با ساخت داشبوردهای Grafana، پیکربندی آستانه‌ها (Thresholds) و ایجاد قوانین هشدار با Prometheus و Alertmanager برای شناسایی سریع حوادث عملیاتی، بصری‌سازی متریک‌ها و سیستم‌های هشدار را بررسی خواهید کرد. در ادامه، لاگ‌گذاری متمرکز و تریسینگ توزیع‌شده (Distributed Tracing) را بررسی کرده و یاد می‌گیرید که چگونه لاگ‌ها و تریس‌ها بینش عمیق‌تری از رفتار سیستم ارائه می‌دهند. با استفاده از Loki، Fluent Bit، OpenTelemetry و Jaeger، نحوه تجمیع لاگ‌ها، ردیابی درخواست‌ها در میکروسرویس‌ها و تحلیل وابستگی‌های سرویس و تأخیر درخواست‌ها را خواهید آموخت. همچنین یاد می‌گیرید که پلتفرم‌های مدرن مشاهده‌پذیری چگونه از شناسایی ناهنجاری‌های مبتنی بر هوش مصنوعی در Grafana برای شناسایی رفتارهای غیرعادی سیستم و پشتیبانی از مانیتورینگ پیش‌دستانه استفاده می‌کنند. در پایان این برنامه، شما قادر خواهید بود: - اصول مشاهده‌پذیری را توضیح داده و آن را از مانیتورینگ متمایز کنید. - متریک‌های سیستم را با استفاده از Prometheus و PromQL جمع‌آوری و تحلیل کنید. - داشبوردها و بصری‌سازی‌ها را با استفاده از Grafana طراحی کنید. - هشدارها و اعلان‌های حوادث را با استفاده از Prometheus و Alertmanager پیکربندی کنید. - خط لوله‌های لاگ‌گذاری متمرکز را با استفاده از Loki و Fluent Bit پیاده‌سازی کنید. - سیستم‌های توزیع‌شده را با OpenTelemetry تجهیز کرده و تریس‌ها را با استفاده از Jaeger تحلیل کنید. این برنامه برای مهندسان DevOps، مهندسان SRE (قابلیت اطمینان سایت)، توسعه‌دهندگان نرم‌افزار و مهندسان کلاود که می‌خواهند قابلیت اطمینان سیستم و دید عملیاتی خود را بهبود بخشند، طراحی شده است. درک اولیه از زیرساخت‌های ابری، سیستم‌های کانتینری و معماری اپلیکیشن به بیشینه کردن تجربه یادگیری شما کمک می‌کند. زبان‌آموزان به یک اتصال اینترنت پایدار، یک مرورگر وب مدرن و دسترسی به ابزارهای رایج مشاهده‌پذیری نیاز دارند؛ هیچ سخت‌افزار تخصصی یا تنظیمات پیچیده زیرساختی مورد نیاز نیست. به ما بپیوندید تا در متدهای مدرن مشاهده‌پذیری استاد شوید و بیاموزید که تیم‌های مهندسی چگونه سیستم‌های توزیع‌شده را با استفاده از تکنولوژی‌های قدرتمند و متن‌باز مانیتور، عیب‌یابی و بهینه‌سازی می‌کنند.

سرفصل ها و درس ها

مبانی مشاهده‌پذیری و سیگنال‌های سیستم Fundamentals of Observability and System Signals

معرفی دوره Course Introduction
سناریو: بررسی رفتار غیرمنتظره سیستم Scenario: Investigating Unexpected System Behaviour
مشاهده‌پذیری (Observability) چیست؟ What is Observability?
مانیتورینگ چیست؟ What is Monitoring?
مقایسه مشاهده‌پذیری و مانیتورینگ در سیستم‌های مدرن Observability vs Monitoring in Modern Systems
سه ستون اصلی مشاهده‌پذیری The Three Pillars of Observability
دمو: نصب Prometheus برای جمع‌آوری متریک‌ها Demonstration: Installing Prometheus for Metrics Collection
دمو: پیکربندی Node Exporter برای متریک‌های میزبان Demonstration: Configuring Node Exporter for Host Metrics
متریک‌ها، سیگنال‌های طلایی و شاخص‌های قابلیت اطمینان Metrics, Golden Signals, and Reliability Indicators
قابلیت اطمینان سرویس با SLIها، SLOها و بودجه‌های خطا Service Reliability with SLIs, SLOs, and Error Budgets
دمو: بررسی متریک‌های اپلیکیشن در Prometheus Demonstration: Exploring Application Metrics Exposed with Prometheus
دمو: کوئری‌های PromQL برای متریک‌های تأخیر و خطا Demonstration:PromQL Queries for Latency and Error Metrics
دمو: تعریف شاخص‌های سطح سرویس با استفاده از متریک‌های Prometheus Demonstration: Defining Service-Level Indicators Using Prometheus Metrics
معماری Prometheus و مدل داده‌های سری زمانی Prometheus Architecture and Time-Series Data Model
دمو: استخراج متریک‌ها از یک اپلیکیشن نمونه Demonstration: Scraping Metrics from a Sample Application
دمو: استفاده از PromQL برای تجمیع و فیلترینگ Demonstration: Using PromQL for Aggregation and Filtering

بصری‌سازی، هشدارها و خط لوله‌های لاگ‌گذاری Visualization, Alerting, and Logging Pipelines

بصری‌سازی متریک‌ها و طراحی داشبورد Metrics Visualization and Dashboard Design
دمو: نصب Grafana و اتصال به Prometheus Demonstration: Installing Grafana and Connecting Prometheus
دمو: ایجاد داشبوردهای سری زمانی در Grafana Demonstration: Creating Time-Series Dashboards in Grafana
دمو: پیکربندی آستانه‌ها و یادداشت‌ها در Grafana Demonstration: Configuring Thresholds and Annotations in Grafana
استراتژی‌های هشدار و خستگی از هشدارها (Alert Fatigue) Alerting Strategies and Alert Fatigue
دمو: ایجاد قوانین هشدار در Prometheus Demonstration: Creating Alert Rules in Prometheus
دمو: پیکربندی Alertmanager برای ارسال اعلان‌ها Demonstration: Configuring Alertmanager for Notifications
دمو: اعتبارسنجی تحریک هشدار و بازیابی Demonstration: Alert Trigger and Recovery Validation
لاگ‌گذاری ساختاریافته و خط لوله‌های لاگ Structured Logging and Log Pipelines
دمو: نصب Loki برای تجمیع لاگ‌ها Demonstration: Installing Loki for Log Aggregation
دمو: ارسال لاگ‌های اپلیکیشن به Loki Demonstration: Shipping Application Logs to Loki
دمو: کوئری زدن روی لاگ‌ها با استفاده از LogQL Demonstration: Querying Logs Using LogQL

تریسینگ توزیع‌شده و مشاهده‌پذیری جامع (End to End) Distributed Tracing and End-to-End Observability

مفاهیم و اصطلاحات تریسینگ توزیع‌شده Distributed Tracing Concepts and Terminology
کانتکست تریس، اسپن‌ها و وابستگی‌های سرویس Trace Context, Spans, and Service Dependencies
دمو: تجهیز اپلیکیشن با SDK OpenTelemetry Demonstration: Instrumenting an Application with OpenTelemetry SDK
دمو: اکسپورت کردن تریس‌ها به Jaeger Demonstration: Exporting Traces to Jaeger
دمو: تحلیل تأخیر درخواست‌ها بین سرویس‌ها در Jaeger Demonstration: Analyzing Request Latency Across Services in Jaeger
چالش‌های مشاهده‌پذیری در محیط‌های کوبرنتیز Observability Challenges in Kubernetes Environments
دمو: جمع‌آوری متریک‌های کوبرنتیز با Prometheus Demonstration: Collecting Kubernetes Metrics Using Prometheus
دمو: جمع‌آوری لاگ‌های کانتینر با Fluent Bit Demonstration: Collecting Container Logs with Fluent Bit
دمو: ردیابی درخواست‌ها در میکروسرویس‌ها با Jaeger Demonstration: Tracing Requests Across Microservices in Jaeger
استراتژی‌های همبستگی (Correlation) بین سیگنال‌های تله‌متری Correlation Strategies Across Telemetry Signals
دمو: تحلیل تأخیر درخواست‌ها با استفاده از تریس‌های توزیع‌شده Demonstration: Analyzing Request Latency Using Distributed Traces
معرفی هوش مصنوعی و یادگیری ماشین در مشاهده‌پذیری Introduction to AI and Machine Learning in Observability
نحوه استفاده Grafana از AI برای شناسایی ناهنجاری و تحلیل How Grafana Uses AI for Anomaly Detection and Insight
دمو: فعال‌سازی شناسایی ناهنجاری مبتنی بر ML در Grafana Demonstration: Enabling Machine Learning - Based Anomaly Detection in Grafana

جمع‌بندی دوره و ارزیابی Course Wrap-Up and Assessment

جمع‌بندی نهایی دوره Course Summary

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش مهندسی مشاهده‌پذیری (Observability): متریک‌ها، لاگ‌ها و تریس‌ها

جزییات دوره

زمان دوره: 12h 12m

تعداد ویدیو ها: 43

شرکت: Coursera (کورسرا)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 162

امتیاز مرجع: - از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Chris Croft

لینک کوتاه این دوره

https://donyad.com/d/03a646

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

آموزش مهندسی مشاهده‌پذیری (Observability): متریک‌ها، لاگ‌ها و تریس‌ها - آخرین آپدیت

دانلود Observability Engineering: Metrics, Logs, and Traces

مبانی مشاهده‌پذیری و سیگنال‌های سیستم Fundamentals of Observability and System Signals

معرفی دوره Course Introduction

سناریو: بررسی رفتار غیرمنتظره سیستم Scenario: Investigating Unexpected System Behaviour

مشاهده‌پذیری (Observability) چیست؟ What is Observability?

مانیتورینگ چیست؟ What is Monitoring?

مقایسه مشاهده‌پذیری و مانیتورینگ در سیستم‌های مدرن Observability vs Monitoring in Modern Systems

سه ستون اصلی مشاهده‌پذیری The Three Pillars of Observability

دمو: نصب Prometheus برای جمع‌آوری متریک‌ها Demonstration: Installing Prometheus for Metrics Collection

دمو: پیکربندی Node Exporter برای متریک‌های میزبان Demonstration: Configuring Node Exporter for Host Metrics

متریک‌ها، سیگنال‌های طلایی و شاخص‌های قابلیت اطمینان Metrics, Golden Signals, and Reliability Indicators

قابلیت اطمینان سرویس با SLIها، SLOها و بودجه‌های خطا Service Reliability with SLIs, SLOs, and Error Budgets

دمو: بررسی متریک‌های اپلیکیشن در Prometheus Demonstration: Exploring Application Metrics Exposed with Prometheus

دمو: کوئری‌های PromQL برای متریک‌های تأخیر و خطا Demonstration:PromQL Queries for Latency and Error Metrics

دمو: تعریف شاخص‌های سطح سرویس با استفاده از متریک‌های Prometheus Demonstration: Defining Service-Level Indicators Using Prometheus Metrics

معماری Prometheus و مدل داده‌های سری زمانی Prometheus Architecture and Time-Series Data Model

دمو: استخراج متریک‌ها از یک اپلیکیشن نمونه Demonstration: Scraping Metrics from a Sample Application

دمو: استفاده از PromQL برای تجمیع و فیلترینگ Demonstration: Using PromQL for Aggregation and Filtering

بصری‌سازی، هشدارها و خط لوله‌های لاگ‌گذاری Visualization, Alerting, and Logging Pipelines

بصری‌سازی متریک‌ها و طراحی داشبورد Metrics Visualization and Dashboard Design

دمو: نصب Grafana و اتصال به Prometheus Demonstration: Installing Grafana and Connecting Prometheus

دمو: ایجاد داشبوردهای سری زمانی در Grafana Demonstration: Creating Time-Series Dashboards in Grafana

دمو: پیکربندی آستانه‌ها و یادداشت‌ها در Grafana Demonstration: Configuring Thresholds and Annotations in Grafana

استراتژی‌های هشدار و خستگی از هشدارها (Alert Fatigue) Alerting Strategies and Alert Fatigue

دمو: ایجاد قوانین هشدار در Prometheus Demonstration: Creating Alert Rules in Prometheus

دمو: پیکربندی Alertmanager برای ارسال اعلان‌ها Demonstration: Configuring Alertmanager for Notifications

دمو: اعتبارسنجی تحریک هشدار و بازیابی Demonstration: Alert Trigger and Recovery Validation

لاگ‌گذاری ساختاریافته و خط لوله‌های لاگ Structured Logging and Log Pipelines

دمو: نصب Loki برای تجمیع لاگ‌ها Demonstration: Installing Loki for Log Aggregation

دمو: ارسال لاگ‌های اپلیکیشن به Loki Demonstration: Shipping Application Logs to Loki

دمو: کوئری زدن روی لاگ‌ها با استفاده از LogQL Demonstration: Querying Logs Using LogQL

تریسینگ توزیع‌شده و مشاهده‌پذیری جامع (End to End) Distributed Tracing and End-to-End Observability

مفاهیم و اصطلاحات تریسینگ توزیع‌شده Distributed Tracing Concepts and Terminology

کانتکست تریس، اسپن‌ها و وابستگی‌های سرویس Trace Context, Spans, and Service Dependencies

دمو: تجهیز اپلیکیشن با SDK OpenTelemetry Demonstration: Instrumenting an Application with OpenTelemetry SDK

دمو: اکسپورت کردن تریس‌ها به Jaeger Demonstration: Exporting Traces to Jaeger

دمو: تحلیل تأخیر درخواست‌ها بین سرویس‌ها در Jaeger Demonstration: Analyzing Request Latency Across Services in Jaeger

چالش‌های مشاهده‌پذیری در محیط‌های کوبرنتیز Observability Challenges in Kubernetes Environments

دمو: جمع‌آوری متریک‌های کوبرنتیز با Prometheus Demonstration: Collecting Kubernetes Metrics Using Prometheus

دمو: جمع‌آوری لاگ‌های کانتینر با Fluent Bit Demonstration: Collecting Container Logs with Fluent Bit

دمو: ردیابی درخواست‌ها در میکروسرویس‌ها با Jaeger Demonstration: Tracing Requests Across Microservices in Jaeger

استراتژی‌های همبستگی (Correlation) بین سیگنال‌های تله‌متری Correlation Strategies Across Telemetry Signals

دمو: تحلیل تأخیر درخواست‌ها با استفاده از تریس‌های توزیع‌شده Demonstration: Analyzing Request Latency Using Distributed Traces

معرفی هوش مصنوعی و یادگیری ماشین در مشاهده‌پذیری Introduction to AI and Machine Learning in Observability

نحوه استفاده Grafana از AI برای شناسایی ناهنجاری و تحلیل How Grafana Uses AI for Anomaly Detection and Insight

دمو: فعال‌سازی شناسایی ناهنجاری مبتنی بر ML در Grafana Demonstration: Enabling Machine Learning - Based Anomaly Detection in Grafana

جمع‌بندی دوره و ارزیابی Course Wrap-Up and Assessment

جمع‌بندی نهایی دوره Course Summary

نمایش نظرات

https://donyad.com/d/03a646