Skip to content

[Priority: Low] [Feature/Ops] 增强结构化指标监控与链路追踪支持 #277

@liujuanjuan1984

Description

@liujuanjuan1984

背景

当前主干已经有一套轻量日志指标:执行层和 server handler 会输出如 a2a_stream_requests_totala2a_stream_activea2a_cancel_requests_total 等 metric log record,并已有对应测试与文档说明。

但这套 observability 仍停留在日志维度,尚未提供标准化 metrics export 或 trace context 串联能力。

当前问题

  1. 没有可抓取的 /metrics 或等价导出接口。
  2. 没有 Prometheus / OpenTelemetry 兼容的标准输出。
  3. 当前请求链路中也没有明确的 traceparent / trace context 透传与关联策略。

因此,虽然已有基础 metric signals,但对运维系统和链路分析系统来说,可消费性仍然偏弱。

期望方向

评估是否增加一套可选的标准化 observability 接口:

  • 可选的 metrics export(例如 Prometheus scrape endpoint 或其他标准导出);
  • trace context 透传与日志/请求关联;
  • 保持当前轻量日志指标作为默认低依赖模式。

非目标

  • 不要求默认引入重量级 observability 依赖。
  • 不要求改变当前已有 metric log record 名称与测试契约。
  • 不在本 issue 内同时解决上游并发控制、背压或 session 管理问题。

建议实施步骤

  1. 盘点当前已输出的 metric signals 与消费方缺口。
  2. 明确是否需要新增配置开关以启用 /metrics 或 tracing 集成。
  3. 设计 trace context 在 A2A inbound -> OpenCode upstream -> peer A2A call 链路中的透传边界。
  4. 若进入实现阶段,再拆分 metrics export 与 tracing 两部分改动。

验收标准

  • 明确默认日志指标模式与标准化导出模式的职责分界。
  • 明确 metrics export 的开关、格式和兼容边界。
  • 明确 trace context 透传策略。
  • 若进入实现阶段,补齐文档与回归测试。

Metadata

Metadata

Assignees

No one assigned

    Labels

    status:todoPlanned but not started

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions