Skip to content

miao339/jue-agent-runtime

Repository files navigation

觉-判断系统(Jue Judgment System)

中文 | English | 教程

觉,英文写作 Jue,是一个给 Agent 使用的领域判断系统。它不是普通提示词包,也不是固定工作流,而是让模型在真实任务中更容易保持判断:我现在在做什么、用户真正要什么、证据够不够、是不是该切换领域、是不是被自己的解释或工具惯性带偏了。

当前仓库 jue-agent-runtime 是觉-判断系统的 Claude Code 适配器和可运行 runtime。它现在以插件形式落地,但目标已经不只是“一个插件”,而是一套相对自洽的 Agent 方向系统。

名字

这个项目可以这样称呼:

  1. 中文正式名:觉-判断系统
  2. 中文简称:
  3. 英文正式名:Jue Judgment System
  4. 英文简称:Jue
  5. 工程实现名:Jue Agent Runtime
  6. 领域主体机制:Harness3
  7. Claude Code 适配器:Jue for Claude Code

为什么做 Jue

很多 Agent 会积累“方法”:怎么调用工具、怎么跑测试、怎么按流程做事。Jue 更关注“判断理由”:在什么情境下做出了什么判断,为什么这个判断成立,这个结构以后还能不能复用。

在代码修复、法律、研究、运营、销售策略这类任务里,真正困难的地方往往不是会不会用工具,而是:

  1. 什么才是用户真正要解决的问题。
  2. 现在缺少什么证据。
  3. 第一个看起来很顺的解释是不是太顺了。
  4. 当前任务是否已经进入某个专业领域。
  5. 模型是否应该停下来回神,而不是继续沿着惯性执行。

Jue 的目标不是替代模型能力,而是给模型一个可进化的判断系统。

它要解决的问题是:模型在垂直领域里经常“不知道该朝哪个方向判断”。它可能会很会写代码、很会总结、很会调用工具,但进入冷门领域、复杂业务、长链路任务时,真正缺的是领域方向感:哪些现象重要,哪些证据必须先拿,哪种失败模式最容易骗过自己,什么时候应该记录判断、什么时候应该沉淀手法。

在代码修复这种厂商重点训练的能力上,Jue 的效果可能不会表现成“模型突然会写代码”。我们的早期实测更明显看到的是:模型更快抓住修复主轴,减少反复撞墙,整体修复效率提升。它会带来少量额外 token 消耗,但这部分提示通常稳定、重复,支持缓存的平台会有较好的缓存命中,因此不必过度担心。

在冷门领域、私有业务、模型厂商训练覆盖不到的地方,领域判断、判断累积和可复用手法库会更有价值。Jue 的核心不是给所有问题一个答案,而是让模型能逐渐长出“这个领域该怎么判断”的能力。

核心概念

  1. ROOT_SOUL:判断底座。它回答判断力从哪里来,强调诚意、不自欺、感通用户和事情。
  2. PARADIGM:没有激活领域时的默认判断办法。
  3. Harness3:领域判断主体。进入代码修复、法律审查、研究等领域时,用对应 harness 替换默认 PARADIGM。
  4. SMALL_SOUL:回神机制。长任务中途把模型拉回来做一次实时慎独,不是总结报告。
  5. JudgmentTriplet:判断累积。记录“情境、判断、结构”,用于生成或进化 harness。
  6. Domain moves:领域手法库。低权重、按需搜索,不常驻注入,也不替代判断。

Harness 常被翻译成“马具、吊具、驾驭装置”。在 Jue 里,它不是束缚模型的绳子,而是让模型在某个领域里有可驾驭的方向:知道先看什么、怎么判断、最容易在哪里自欺、怎样才算真的闭合。Harness3 就是第三代领域判断主体。

一句话结构:

ROOT_SOUL
+ PARADIGM / active Harness3
+ global triplets / domain judgments / domain moves
+ SMALL_SOUL heartbeat

当前适配器

这个仓库当前包含 Claude Code 插件适配:

.claude-plugin/plugin.json
.mcp.json
hooks/hooks.json
agents/jue.md
server/
scripts/
skills/

它通过 Claude Code 的 plugin、MCP、hooks、statusline 和 PowerShell wrapper 接入,不修改 Claude Code 本体。

安装

要求:

  1. Node.js 和 npm。
  2. Claude Code CLI,并且 claude 在 PATH 中可用。

安装依赖:

git clone https://github.com/miao339/jue-agent-runtime.git
cd jue-agent-runtime
npm install

验证:

npm test
claude plugin validate .

推荐命令约定:

claude      # 原版 Claude Code
claude-jue  # Jue 版 Claude Code

启动 Jue 版 Claude Code:

claude-jue

如果还没有把 wrapper 加到 PowerShell profile,也可以直接运行仓库脚本:

.\bin\claude-jue.ps1

或者用原版 claude 显式加载插件:

claude --plugin-dir . --agent jue:jue --append-system-prompt-file .\root\BOOTSTRAP.md

基本用法

多数时候自然语言就够了。你可以直接说:

这是一个代码修复任务,先判断应该用哪个领域。
记录一下刚才这个判断。
这个失败模式以后可能复用,看看要不要进化当前 harness。
帮我为合同审查创建一个新的 harness3。
现在我有点怀疑方向偏了,触发一次回神。

你也可以用管理命令查看或切换:

npm run jue -- status
npm run jue -- list
npm run jue -- activate bug-fixing
npm run jue -- deactivate

更完整的使用方式见 教程

回神阈值

默认回神触发阈值:

工具批次:6
工具调用:6
工具失败:立即触发
领域切换后:激活工具批次先做领域方向小结;第一次实际工具批次后触发领域回神

可以通过环境变量调整:

$env:JUE_HEARTBEAT_TOOL_BATCH_THRESHOLD="6"
$env:JUE_HEARTBEAT_TOOL_CALL_THRESHOLD="6"

调大可以减少打断,调小可以让模型更频繁回看自己。建议先用默认值,等真实任务里感觉回神太频繁或太慢,再调整。

领域切换是两阶段状态机:工具发现、普通读取等非激活工具不会消费“领域方向小结”;只有真正的 activate_harness 批次会触发方向小结,然后下一次实际工具批次才触发领域回神。PostToolBatch 也会按当前 session 恢复状态,避免 A1/A2 或多会话串领域。

数据目录

默认运行态数据不写入仓库,而是放在:

~/.jue-claude-code

可用环境变量覆盖:

$env:JUE_STATE_DIR="C:\path\to\jue-state"
$env:JUE_LOG_DIR="C:\path\to\jue-logs"

开发与测试

npm test
claude plugin validate .

常用开发入口:

server/jue/context.mjs      # 上下文注入和回神触发
server/jue/tool.mjs         # river_harness MCP 工具入口
server/jue/harnesses.mjs    # harness 创建、进化、读取
server/jue/triplets.mjs     # 判断累积
server/jue/moves.mjs        # 领域手法库
test/jue.test.mjs           # 运行时测试

项目状态

这是早期公开版本,已经跑通:

  1. ROOT_SOUL / PARADIGM / active Harness3 的判断主体切换。
  2. 全局 triplets 与领域 judgments 分离。
  3. 领域 moves 按需搜索。
  4. SMALL_SOUL heartbeat 和领域回神。
  5. Claude Code MCP、hooks、statusline、wrapper 集成。

后续会继续抽象出更通用的 agent runtime,让 Jue 能适配更多 Agent 平台。

许可证

MIT License。详见 LICENSE

About

Jue judgment system for Claude Code: agent judgment, harness switching, and noncommercial source-available runtime.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors