لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مهندسی مشاهدهپذیری (Observability): متریکها، لاگها و تریسها
- آخرین آپدیت
دانلود Observability Engineering: Metrics, Logs, and Traces
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
این برنامه آموزشی بررسی میکند که چگونه مشاهدهپذیری (Observability) مهندسان را قادر میسازد تا سیستمهای توزیعشده مدرن را با استفاده از متریکها، لاگها و تریسها درک، مانیتور و عیبیابی کنند. شما با یادگیری اصول بنیادی مشاهدهپذیری شروع خواهید کرد، تفاوت آن را با مانیتورینگ سنتی درک میکنید و سه ستون اصلی مشاهدهپذیری را بررسی خواهید کرد. از طریق دموهای عملی با Prometheus و Node Exporter، یاد میگیرید که تلهمتری سیستم چگونه جمعآوری میشود و متریکها چگونه دید کافی نسبت به زیرساخت و رفتار اپلیکیشن ایجاد میکنند.
سپس استراتژیهای متریک با تمرکز بر قابلیت اطمینان را با استفاده از مفاهیمی مانند Golden Signals، شاخصهای سطح سرویس (SLIs)، اهداف سطح سرویس (SLOs) و بودجههای خطا (Error Budgets) طراحی خواهید کرد. نمایشهای عملی نشان میدهند که چگونه متریکهای اپلیکیشن را جمعآوری کنید، کوئریهای PromQL بنویسید و الگوهای تأخیر و خطا را تحلیل کنید. همچنین با ساخت داشبوردهای Grafana، پیکربندی آستانهها (Thresholds) و ایجاد قوانین هشدار با Prometheus و Alertmanager برای شناسایی سریع حوادث عملیاتی، بصریسازی متریکها و سیستمهای هشدار را بررسی خواهید کرد.
در ادامه، لاگگذاری متمرکز و تریسینگ توزیعشده (Distributed Tracing) را بررسی کرده و یاد میگیرید که چگونه لاگها و تریسها بینش عمیقتری از رفتار سیستم ارائه میدهند. با استفاده از Loki، Fluent Bit، OpenTelemetry و Jaeger، نحوه تجمیع لاگها، ردیابی درخواستها در میکروسرویسها و تحلیل وابستگیهای سرویس و تأخیر درخواستها را خواهید آموخت. همچنین یاد میگیرید که پلتفرمهای مدرن مشاهدهپذیری چگونه از شناسایی ناهنجاریهای مبتنی بر هوش مصنوعی در Grafana برای شناسایی رفتارهای غیرعادی سیستم و پشتیبانی از مانیتورینگ پیشدستانه استفاده میکنند.
در پایان این برنامه، شما قادر خواهید بود:
- اصول مشاهدهپذیری را توضیح داده و آن را از مانیتورینگ متمایز کنید.
- متریکهای سیستم را با استفاده از Prometheus و PromQL جمعآوری و تحلیل کنید.
- داشبوردها و بصریسازیها را با استفاده از Grafana طراحی کنید.
- هشدارها و اعلانهای حوادث را با استفاده از Prometheus و Alertmanager پیکربندی کنید.
- خط لولههای لاگگذاری متمرکز را با استفاده از Loki و Fluent Bit پیادهسازی کنید.
- سیستمهای توزیعشده را با OpenTelemetry تجهیز کرده و تریسها را با استفاده از Jaeger تحلیل کنید.
این برنامه برای مهندسان DevOps، مهندسان SRE (قابلیت اطمینان سایت)، توسعهدهندگان نرمافزار و مهندسان کلاود که میخواهند قابلیت اطمینان سیستم و دید عملیاتی خود را بهبود بخشند، طراحی شده است. درک اولیه از زیرساختهای ابری، سیستمهای کانتینری و معماری اپلیکیشن به بیشینه کردن تجربه یادگیری شما کمک میکند.
زبانآموزان به یک اتصال اینترنت پایدار، یک مرورگر وب مدرن و دسترسی به ابزارهای رایج مشاهدهپذیری نیاز دارند؛ هیچ سختافزار تخصصی یا تنظیمات پیچیده زیرساختی مورد نیاز نیست.
به ما بپیوندید تا در متدهای مدرن مشاهدهپذیری استاد شوید و بیاموزید که تیمهای مهندسی چگونه سیستمهای توزیعشده را با استفاده از تکنولوژیهای قدرتمند و متنباز مانیتور، عیبیابی و بهینهسازی میکنند.
سرفصل ها و درس ها
مبانی مشاهدهپذیری و سیگنالهای سیستم
Fundamentals of Observability and System Signals
معرفی دوره
Course Introduction
سناریو: بررسی رفتار غیرمنتظره سیستم
Scenario: Investigating Unexpected System Behaviour
مشاهدهپذیری (Observability) چیست؟
What is Observability?
مانیتورینگ چیست؟
What is Monitoring?
مقایسه مشاهدهپذیری و مانیتورینگ در سیستمهای مدرن
Observability vs Monitoring in Modern Systems
سه ستون اصلی مشاهدهپذیری
The Three Pillars of Observability
دمو: نصب Prometheus برای جمعآوری متریکها
Demonstration: Installing Prometheus for Metrics Collection
دمو: پیکربندی Node Exporter برای متریکهای میزبان
Demonstration: Configuring Node Exporter for Host Metrics
متریکها، سیگنالهای طلایی و شاخصهای قابلیت اطمینان
Metrics, Golden Signals, and Reliability Indicators
قابلیت اطمینان سرویس با SLIها، SLOها و بودجههای خطا
Service Reliability with SLIs, SLOs, and Error Budgets
دمو: بررسی متریکهای اپلیکیشن در Prometheus
Demonstration: Exploring Application Metrics Exposed with Prometheus
دمو: کوئریهای PromQL برای متریکهای تأخیر و خطا
Demonstration:PromQL Queries for Latency and Error Metrics
دمو: تعریف شاخصهای سطح سرویس با استفاده از متریکهای Prometheus
Demonstration: Defining Service-Level Indicators Using Prometheus Metrics
معماری Prometheus و مدل دادههای سری زمانی
Prometheus Architecture and Time-Series Data Model
دمو: استخراج متریکها از یک اپلیکیشن نمونه
Demonstration: Scraping Metrics from a Sample Application
دمو: استفاده از PromQL برای تجمیع و فیلترینگ
Demonstration: Using PromQL for Aggregation and Filtering
بصریسازی، هشدارها و خط لولههای لاگگذاری
Visualization, Alerting, and Logging Pipelines
بصریسازی متریکها و طراحی داشبورد
Metrics Visualization and Dashboard Design
دمو: نصب Grafana و اتصال به Prometheus
Demonstration: Installing Grafana and Connecting Prometheus
دمو: ایجاد داشبوردهای سری زمانی در Grafana
Demonstration: Creating Time-Series Dashboards in Grafana
دمو: پیکربندی آستانهها و یادداشتها در Grafana
Demonstration: Configuring Thresholds and Annotations in Grafana
استراتژیهای هشدار و خستگی از هشدارها (Alert Fatigue)
Alerting Strategies and Alert Fatigue
دمو: ایجاد قوانین هشدار در Prometheus
Demonstration: Creating Alert Rules in Prometheus
دمو: پیکربندی Alertmanager برای ارسال اعلانها
Demonstration: Configuring Alertmanager for Notifications
دمو: اعتبارسنجی تحریک هشدار و بازیابی
Demonstration: Alert Trigger and Recovery Validation
لاگگذاری ساختاریافته و خط لولههای لاگ
Structured Logging and Log Pipelines
دمو: نصب Loki برای تجمیع لاگها
Demonstration: Installing Loki for Log Aggregation
دمو: ارسال لاگهای اپلیکیشن به Loki
Demonstration: Shipping Application Logs to Loki
دمو: کوئری زدن روی لاگها با استفاده از LogQL
Demonstration: Querying Logs Using LogQL
تریسینگ توزیعشده و مشاهدهپذیری جامع (End to End)
Distributed Tracing and End-to-End Observability
مفاهیم و اصطلاحات تریسینگ توزیعشده
Distributed Tracing Concepts and Terminology
کانتکست تریس، اسپنها و وابستگیهای سرویس
Trace Context, Spans, and Service Dependencies
دمو: تجهیز اپلیکیشن با SDK OpenTelemetry
Demonstration: Instrumenting an Application with OpenTelemetry SDK
دمو: اکسپورت کردن تریسها به Jaeger
Demonstration: Exporting Traces to Jaeger
دمو: تحلیل تأخیر درخواستها بین سرویسها در Jaeger
Demonstration: Analyzing Request Latency Across Services in Jaeger
چالشهای مشاهدهپذیری در محیطهای کوبرنتیز
Observability Challenges in Kubernetes Environments
دمو: جمعآوری متریکهای کوبرنتیز با Prometheus
Demonstration: Collecting Kubernetes Metrics Using Prometheus
دمو: جمعآوری لاگهای کانتینر با Fluent Bit
Demonstration: Collecting Container Logs with Fluent Bit
دمو: ردیابی درخواستها در میکروسرویسها با Jaeger
Demonstration: Tracing Requests Across Microservices in Jaeger
استراتژیهای همبستگی (Correlation) بین سیگنالهای تلهمتری
Correlation Strategies Across Telemetry Signals
دمو: تحلیل تأخیر درخواستها با استفاده از تریسهای توزیعشده
Demonstration: Analyzing Request Latency Using Distributed Traces
معرفی هوش مصنوعی و یادگیری ماشین در مشاهدهپذیری
Introduction to AI and Machine Learning in Observability
نحوه استفاده Grafana از AI برای شناسایی ناهنجاری و تحلیل
How Grafana Uses AI for Anomaly Detection and Insight
دمو: فعالسازی شناسایی ناهنجاری مبتنی بر ML در Grafana
Demonstration: Enabling Machine Learning - Based Anomaly Detection in Grafana
جمعبندی دوره و ارزیابی
Course Wrap-Up and Assessment
نمایش نظرات