What is Observability?

Observability(관측가능성, 관찰가능성)

왜 정상적으로 동작하지 않는지?
도구(tools)들을 통해 시스템과 애플리케이션에서 발생하는 문제를 파악하는 것
원격측정(Telemetry) Data
- Logs: 타임스탬프 메세지로 나타내는 시스템 이벤트, 상태
- Metrics : 키-밸류 태그를 가지는 집계/통계 데이터 (Gauge, Counter, Histogram 등)
- Traces : 개별 Request가 전체 시스템에 전파(propagate)될 때 경로에 대한 기록
관찰가능성은 예측 불가능한 모든 장애 가능성을 알 수 없다는 것을 전제로 함
예) 데이터베이스에 관련된 인프라 홉과 같은 요청 경로를 추적하고 특정 사용자 및 요청에 대해 데이터베이스 쿼리가 실행된 수준까지 파악하는 것

Observability Journey

Who am I?

Monitoring

Google's Site Reliability Engineering (SRE) book

What is Observability?

Observability(관측가능성, 관찰가능성)

관찰가능성 확보

Metrics

메트릭(Metrics)

메트릭 수집 방식 (Push)

Push

메트릭 수집 방식 (Pull)

Pull

Prometheus

Prometheus

Metric Collector + Metric Database

Prometheus Component

Prometheus Metrics

Prometheus Metrics (Metadata)

Prometheus Metrics (Counter)

카운터(Counter) : 누적 메트릭 타입

Prometheus Metrics (Gauge)

게이지(Gauge)

Prometheus Metrics (Histogram)

히스토그램(Histogram)

Prometheus Metrics (Summary)

서머리(Summary)

Prometheus PromQL

Prometheus Jobs & Instances

Expression Language Data Types

Expression Language Data Types

Metric Collections

Metric Collections

Prometheus Exporter

Prometheus Pushgateway

Prometheus Metric Target

Prometheus Alertmanager

Metrics Visualization

Prometheus Constraints

Books

Traces

Distributed Trace (분산 추적)

What is OpenTelemetry?

Ecosystem

Why OpenTelemetry?

Simple Microservices

Why OpenTelemetry?

Real World is

Context Propagation

Core Concept : 서비스간 트레이스 전달 규약 (W3C, Zipkin B3)

Traces

Spans

W3C Trace Context

Trace Context :https://w3c.github.io/trace-context/

Baggage : https://w3c.github.io/baggage/

Passing Context

Client Architecture

Client Types

Client Data Pipeline

Collector Architecture

Collector Pipeline

Demo

Demo Applications

Demo - Nginx Configuration

Demo - Nginx stub_status

Demo - Nginx Exporter

Java Dependencies (Gradle)

Demo - Java Properties

Demo - Java Environment (Auto)

Demo - Java Environment (Manual)

JVM Metrics

Prometheus Target Discovery

Visualization

Tracing

References

Summary

트러블슈팅 워크플로우

관찰가능성 성숙도

Good Observability (Technical)

Good data can help with the cultural shift to new systems