Add Prometheus /metrics endpoint for inference latency histogram

## Summary

Add a `/metrics` endpoint that exposes Prometheus-compatible metrics for monitoring inference performance in production.

## Details

trio-core's FastAPI server (`src/trio_core/api/server.py`) currently has no observability endpoints. Adding Prometheus metrics would let users monitor inference latency, request counts, and error rates using standard tools (Grafana, Datadog, etc).

## What to Implement

1. Add `prometheus_client` as an optional dependency in `pyproject.toml` (under an `[observability]` extra)
2. Create a `/metrics` endpoint in the API server
3. Expose at minimum:
   - `trio_request_latency_seconds` — Histogram for request duration, labeled by endpoint
   - `trio_requests_total` — Counter for total requests, labeled by endpoint and status
   - `trio_inference_latency_seconds` — Histogram specifically for model inference time
   - `trio_active_requests` — Gauge for currently-in-flight requests

## Acceptance Criteria

- [ ] `GET /metrics` returns Prometheus text format
- [ ] Latency histogram has reasonable buckets (e.g., 0.1, 0.25, 0.5, 1.0, 2.5, 5.0, 10.0 seconds)
- [ ] Metrics are only enabled when `prometheus_client` is installed (graceful degradation)
- [ ] At least one test verifying `/metrics` returns 200 with expected metric names

## Files to Modify

- `pyproject.toml` — add optional dependency
- `src/trio_core/api/server.py` — add middleware and endpoint
- `tests/test_api.py` — add test

## Resources

- [prometheus_client Python docs](https://prometheus.github.io/client_python/)
- [FastAPI + Prometheus example](https://github.com/trallnag/prometheus-fastapi-instrumentator)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add Prometheus /metrics endpoint for inference latency histogram #8

Summary

Details

What to Implement

Acceptance Criteria

Files to Modify

Resources

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Add Prometheus /metrics endpoint for inference latency histogram #8

Description

Summary

Details

What to Implement

Acceptance Criteria

Files to Modify

Resources

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions