模拟真实圆桌会议,异构模型路由 + MMR 意图解析 + 收敛控制,强制批判(5风险+3缺陷),8周可执行计划
单 Agent 的天然缺陷:
- 视角单一:一个人再怎么深度思考,跳不出自己的认知框架
- 缺乏制衡:没人挑刺,方案很容易变成自嗨
- 伪深度:看起来分析了很多,其实是同一个角度翻来覆去
RoundTable 的结构化对抗设计强制打破这个循环:R1 各自独立 → R2 互相引用 → R3 强制批判 → R4 辩论修改 → R5 裁决总结。5 轮下来,至少发现 15+ 风险、9+ 缺陷,方案被反复打磨。
- 真实子 Agent 调用 — 每轮每条发言都是独立 sessions_spawn,模型和思考链互不干扰
- 强制批判深度 — 硬性要求 5 个风险 + 3 个缺陷
- 方案动态演进 — R4 必须标注"原方案 → 修改后 + 修改理由"
- 分歧明确裁决 — R5 Host 不允许回避矛盾,必须逐条裁决
- 产出可直接执行 — 周级任务清单 + 负责人 + 交付物
R1 独立方案 → R2 相互引用 → R3 深度批判 → R4 辩论完善 → R5 最终总结
↓ ↓ ↓ ↓ ↓
3 专家独立 互相引用 5 风险 +3 缺陷 回应所有质疑 裁决分歧
800-1200 字 800-1200 字 1000-1500 字 1000-1500 字 1500-2000 字
| 轮次 | 主题 | 核心任务 | 强制要求 |
|---|---|---|---|
| R1 | 独立方案 | 各自从专业角度给方案 | 至少 1 个对比表格 + 5 个量化指标 |
| R2 | 相互引用 | 引用别人观点 + 补充盲点 | 至少 3 处引用标注 + 明确立场 |
| R3 | 深度批判 | 挑刺——风险和缺陷 | 5 个风险 + 3 个缺陷,每个数据支撑 |
| R4 | 辩论完善 | 回应质疑 + 修订方案 | 修改对比表(原方案 vs 修订后 + 理由) |
| R5 | Host 总结 | 裁决分歧 + 产出计划 | 8 周任务表 + 风险预案 + Top 3 风险 |
v2.0 的致命问题是 R2-R5 不知道前面讨论了什么。v3.0 强制注入完整讨论历史:
- R2:注入 R1 所有专家完整发言
- R3:注入 R1 + R2 历史(批判的对象必须真实)
- R4:注入 R1-R3 历史(回应质疑必须对得上)
- R5:注入 R1-R4 全部历史(否则没法裁决)
┌─────────────────────────────────────────────────────────┐
│ RoundTable Engine │
├─────────────────────────────────────────────────────────┤
│ Intent Parser │ Model Router │ Convergence │
│ (MMR 意图解析) │ (异构路由) │ (收敛控制) │
├────────────────────┼──────────────────┼──────────────────┤
│ Agent Selector │ Prompt Builder │ Notifier │
│ (170+ 专家库) │ (框架模板) │ (飞书通知) │
└─────────────────────────────────────────────────────────┘
用**最大边际相关性(MMR)**算法:
得分 = λ × 相关性 - (1-λ) × 与已选专家的最大相似度
避免"回音室"——3 个专家不能都是同一个方向的。170+ 专家库覆盖工程、设计、产品、安全、性能、增长、运维、数据等领域。
不同专家角色配不同模型,利用各模型的长板:
| 专家角色 | 能力要求 | 推荐模型标签 |
|---|---|---|
| 工程/架构 | 代码、逻辑 | code, technical, engineering |
| 设计/创意 | 长上下文、创意 | creative, long-context, design |
| QA/测试 | 平衡、快速 | balanced, fast, general |
| 产品/业务 | 中文、商业 | chinese, knowledge, product |
| Host 总结 | 逻辑、决策 | logic, summary, decision, max |
三级路由策略:用户显式配置 → OpenClaw 公开 API → 单一模型降级。ClawHub 合规:不扫描 os.environ,不接触 apiKey/baseUrl。
- 语义相似度检测:连续 2 轮内容重复度 > 80% → 自动终止
- 共识检测:R4 后确认 3 条以上共识 → 加速进入 R5
- 硬上限:最多 5 轮,防止 token 爆炸
每轮有专属的 Prompt 框架(prompts/framework.md),硬性约束字数下限、表格要求、引用数量。不同专家角色注入对应的行业模板。
| 场景 | 策略 |
|---|---|
| 子 Agent 超时 | 最多重试 2 次,每次间隔 5 秒 |
| sessions_spawn 不可用 | 硬失败(不降级 mock) |
| R5 Host 失败 | 自动从已有轮次提取摘要生成报告 |
| 模型不可用 | 自动降级到 FALLBACK_MODEL |
- JSON 报告:结构化数据,可二次处理
- Markdown 报告:人类可读,含全部 5 轮内容
- 飞书通知(可选):每轮进度实时推送
- 聊天室模式(可选):讨论过程广播
| 维度 | v2.0 | v3.0 |
|---|---|---|
| 上下文传递 | R2-R5 无前几轮内容 ❌ | 强制注入完整讨论历史 ✅ |
| 批判深度 | 泛泛而谈(~3 个风险) | 硬性 5 风险 + 3 缺陷 |
| 方案演进 | R1-R4 内容重复 | R4 标注修改对比表 |
| 分歧处理 | 无裁决机制 | R5 Host 逐条裁决 |
| 输出质量 | 400-600 字、无表格 | 800-2000 字 + 强制表格 |
| 可执行性 | ~50% | 90%+ |
主题:智能客服系统技术方案
参与专家:工程/产品/设计(3 人)
子 Agent 调用:15 次
风险识别:15 个
方案缺陷:9 个
修改建议:13 处
8 周计划:W1-W8,每日估算工时
分歧裁决:4 项 + 理由
输出字数:~8500 字
| 维度 | 传统单 Agent | RoundTable |
|---|---|---|
| 视角覆盖 | 1 个 | 3-4 个 |
| 风险识别 | 0-2 个 | 5-15 个 |
| 方案修订 | 0 次 | 5-10 处 |
| 计划粒度 | Phase 级 | 周级 |
| 可执行性 | 40-60% | 90%+ |
| ✅ 推荐 | ❌ 不推荐 |
|---|---|
| 技术方案评审(选型、架构) | 简单问答(直接问主 Agent) |
| 产品立项(功能规划、MVP) | 紧急决策(需 15-20 分钟) |
| 复杂决策(多因素权衡) | 代码生成(用 Auto-Coding v3) |
| 跨部门协作(对齐多方视角) | 快速事实查询 |
RoundTable | 圆桌会议 | 圆桌讨论 | 多 Agent 讨论 | 多专家讨论 | 深度讨论
Kris Lu krislu666@foxmail.com
MIT License
更新日期: 2026-05-23