آموزش مهندسی مشاهده‌پذیری (Observability): متریک‌ها، لاگ‌ها و تریس‌ها - آخرین آپدیت

دانلود Observability Engineering: Metrics, Logs, and Traces

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: این برنامه آموزشی بررسی می‌کند که چگونه مشاهده‌پذیری (Observability) مهندسان را قادر می‌سازد تا سیستم‌های توزیع‌شده مدرن را با استفاده از متریک‌ها، لاگ‌ها و تریس‌ها درک، مانیتور و عیب‌یابی کنند. شما با یادگیری اصول بنیادی مشاهده‌پذیری شروع خواهید کرد، تفاوت آن را با مانیتورینگ سنتی درک می‌کنید و سه ستون اصلی مشاهده‌پذیری را بررسی خواهید کرد. از طریق دموهای عملی با Prometheus و Node Exporter، یاد می‌گیرید که تله‌متری سیستم چگونه جمع‌آوری می‌شود و متریک‌ها چگونه دید کافی نسبت به زیرساخت و رفتار اپلیکیشن ایجاد می‌کنند. سپس استراتژی‌های متریک با تمرکز بر قابلیت اطمینان را با استفاده از مفاهیمی مانند Golden Signals، شاخص‌های سطح سرویس (SLIs)، اهداف سطح سرویس (SLOs) و بودجه‌های خطا (Error Budgets) طراحی خواهید کرد. نمایش‌های عملی نشان می‌دهند که چگونه متریک‌های اپلیکیشن را جمع‌آوری کنید، کوئری‌های PromQL بنویسید و الگوهای تأخیر و خطا را تحلیل کنید. همچنین با ساخت داشبوردهای Grafana، پیکربندی آستانه‌ها (Thresholds) و ایجاد قوانین هشدار با Prometheus و Alertmanager برای شناسایی سریع حوادث عملیاتی، بصری‌سازی متریک‌ها و سیستم‌های هشدار را بررسی خواهید کرد. در ادامه، لاگ‌گذاری متمرکز و تریسینگ توزیع‌شده (Distributed Tracing) را بررسی کرده و یاد می‌گیرید که چگونه لاگ‌ها و تریس‌ها بینش عمیق‌تری از رفتار سیستم ارائه می‌دهند. با استفاده از Loki، Fluent Bit، OpenTelemetry و Jaeger، نحوه تجمیع لاگ‌ها، ردیابی درخواست‌ها در میکروسرویس‌ها و تحلیل وابستگی‌های سرویس و تأخیر درخواست‌ها را خواهید آموخت. همچنین یاد می‌گیرید که پلتفرم‌های مدرن مشاهده‌پذیری چگونه از شناسایی ناهنجاری‌های مبتنی بر هوش مصنوعی در Grafana برای شناسایی رفتارهای غیرعادی سیستم و پشتیبانی از مانیتورینگ پیش‌دستانه استفاده می‌کنند. در پایان این برنامه، شما قادر خواهید بود: - اصول مشاهده‌پذیری را توضیح داده و آن را از مانیتورینگ متمایز کنید. - متریک‌های سیستم را با استفاده از Prometheus و PromQL جمع‌آوری و تحلیل کنید. - داشبوردها و بصری‌سازی‌ها را با استفاده از Grafana طراحی کنید. - هشدارها و اعلان‌های حوادث را با استفاده از Prometheus و Alertmanager پیکربندی کنید. - خط لوله‌های لاگ‌گذاری متمرکز را با استفاده از Loki و Fluent Bit پیاده‌سازی کنید. - سیستم‌های توزیع‌شده را با OpenTelemetry تجهیز کرده و تریس‌ها را با استفاده از Jaeger تحلیل کنید. این برنامه برای مهندسان DevOps، مهندسان SRE (قابلیت اطمینان سایت)، توسعه‌دهندگان نرم‌افزار و مهندسان کلاود که می‌خواهند قابلیت اطمینان سیستم و دید عملیاتی خود را بهبود بخشند، طراحی شده است. درک اولیه از زیرساخت‌های ابری، سیستم‌های کانتینری و معماری اپلیکیشن به بیشینه کردن تجربه یادگیری شما کمک می‌کند. زبان‌آموزان به یک اتصال اینترنت پایدار، یک مرورگر وب مدرن و دسترسی به ابزارهای رایج مشاهده‌پذیری نیاز دارند؛ هیچ سخت‌افزار تخصصی یا تنظیمات پیچیده زیرساختی مورد نیاز نیست. به ما بپیوندید تا در متدهای مدرن مشاهده‌پذیری استاد شوید و بیاموزید که تیم‌های مهندسی چگونه سیستم‌های توزیع‌شده را با استفاده از تکنولوژی‌های قدرتمند و متن‌باز مانیتور، عیب‌یابی و بهینه‌سازی می‌کنند.

سرفصل ها و درس ها

مبانی مشاهده‌پذیری و سیگنال‌های سیستم Fundamentals of Observability and System Signals

  • معرفی دوره Course Introduction

  • سناریو: بررسی رفتار غیرمنتظره سیستم Scenario: Investigating Unexpected System Behaviour

  • مشاهده‌پذیری (Observability) چیست؟ What is Observability?

  • مانیتورینگ چیست؟ What is Monitoring?

  • مقایسه مشاهده‌پذیری و مانیتورینگ در سیستم‌های مدرن Observability vs Monitoring in Modern Systems

  • سه ستون اصلی مشاهده‌پذیری The Three Pillars of Observability

  • دمو: نصب Prometheus برای جمع‌آوری متریک‌ها Demonstration: Installing Prometheus for Metrics Collection

  • دمو: پیکربندی Node Exporter برای متریک‌های میزبان Demonstration: Configuring Node Exporter for Host Metrics

  • متریک‌ها، سیگنال‌های طلایی و شاخص‌های قابلیت اطمینان Metrics, Golden Signals, and Reliability Indicators

  • قابلیت اطمینان سرویس با SLIها، SLOها و بودجه‌های خطا Service Reliability with SLIs, SLOs, and Error Budgets

  • دمو: بررسی متریک‌های اپلیکیشن در Prometheus Demonstration: Exploring Application Metrics Exposed with Prometheus

  • دمو: کوئری‌های PromQL برای متریک‌های تأخیر و خطا Demonstration:PromQL Queries for Latency and Error Metrics

  • دمو: تعریف شاخص‌های سطح سرویس با استفاده از متریک‌های Prometheus Demonstration: Defining Service-Level Indicators Using Prometheus Metrics

  • معماری Prometheus و مدل داده‌های سری زمانی Prometheus Architecture and Time-Series Data Model

  • دمو: استخراج متریک‌ها از یک اپلیکیشن نمونه Demonstration: Scraping Metrics from a Sample Application

  • دمو: استفاده از PromQL برای تجمیع و فیلترینگ Demonstration: Using PromQL for Aggregation and Filtering

بصری‌سازی، هشدارها و خط لوله‌های لاگ‌گذاری Visualization, Alerting, and Logging Pipelines

  • بصری‌سازی متریک‌ها و طراحی داشبورد Metrics Visualization and Dashboard Design

  • دمو: نصب Grafana و اتصال به Prometheus Demonstration: Installing Grafana and Connecting Prometheus

  • دمو: ایجاد داشبوردهای سری زمانی در Grafana Demonstration: Creating Time-Series Dashboards in Grafana

  • دمو: پیکربندی آستانه‌ها و یادداشت‌ها در Grafana Demonstration: Configuring Thresholds and Annotations in Grafana

  • استراتژی‌های هشدار و خستگی از هشدارها (Alert Fatigue) Alerting Strategies and Alert Fatigue

  • دمو: ایجاد قوانین هشدار در Prometheus Demonstration: Creating Alert Rules in Prometheus

  • دمو: پیکربندی Alertmanager برای ارسال اعلان‌ها Demonstration: Configuring Alertmanager for Notifications

  • دمو: اعتبارسنجی تحریک هشدار و بازیابی Demonstration: Alert Trigger and Recovery Validation

  • لاگ‌گذاری ساختاریافته و خط لوله‌های لاگ Structured Logging and Log Pipelines

  • دمو: نصب Loki برای تجمیع لاگ‌ها Demonstration: Installing Loki for Log Aggregation

  • دمو: ارسال لاگ‌های اپلیکیشن به Loki Demonstration: Shipping Application Logs to Loki

  • دمو: کوئری زدن روی لاگ‌ها با استفاده از LogQL Demonstration: Querying Logs Using LogQL

تریسینگ توزیع‌شده و مشاهده‌پذیری جامع (End to End) Distributed Tracing and End-to-End Observability

  • مفاهیم و اصطلاحات تریسینگ توزیع‌شده Distributed Tracing Concepts and Terminology

  • کانتکست تریس، اسپن‌ها و وابستگی‌های سرویس Trace Context, Spans, and Service Dependencies

  • دمو: تجهیز اپلیکیشن با SDK OpenTelemetry Demonstration: Instrumenting an Application with OpenTelemetry SDK

  • دمو: اکسپورت کردن تریس‌ها به Jaeger Demonstration: Exporting Traces to Jaeger

  • دمو: تحلیل تأخیر درخواست‌ها بین سرویس‌ها در Jaeger Demonstration: Analyzing Request Latency Across Services in Jaeger

  • چالش‌های مشاهده‌پذیری در محیط‌های کوبرنتیز Observability Challenges in Kubernetes Environments

  • دمو: جمع‌آوری متریک‌های کوبرنتیز با Prometheus Demonstration: Collecting Kubernetes Metrics Using Prometheus

  • دمو: جمع‌آوری لاگ‌های کانتینر با Fluent Bit Demonstration: Collecting Container Logs with Fluent Bit

  • دمو: ردیابی درخواست‌ها در میکروسرویس‌ها با Jaeger Demonstration: Tracing Requests Across Microservices in Jaeger

  • استراتژی‌های همبستگی (Correlation) بین سیگنال‌های تله‌متری Correlation Strategies Across Telemetry Signals

  • دمو: تحلیل تأخیر درخواست‌ها با استفاده از تریس‌های توزیع‌شده Demonstration: Analyzing Request Latency Using Distributed Traces

  • معرفی هوش مصنوعی و یادگیری ماشین در مشاهده‌پذیری Introduction to AI and Machine Learning in Observability

  • نحوه استفاده Grafana از AI برای شناسایی ناهنجاری و تحلیل How Grafana Uses AI for Anomaly Detection and Insight

  • دمو: فعال‌سازی شناسایی ناهنجاری مبتنی بر ML در Grafana Demonstration: Enabling Machine Learning - Based Anomaly Detection in Grafana

جمع‌بندی دوره و ارزیابی Course Wrap-Up and Assessment

  • جمع‌بندی نهایی دوره Course Summary

نمایش نظرات

آموزش مهندسی مشاهده‌پذیری (Observability): متریک‌ها، لاگ‌ها و تریس‌ها
جزییات دوره
12h 12m
43
(آخرین آپدیت)
162
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده