Skip to content

Krislu1221/Claw-auto-coding

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Auto-Coding v3.7.0 - 智能自主编码系统

Version License Python

全子代理架构 + 分阶段技能注入。8 步循环、Reviewer 否决权、Risk Scorecard 量化检测、Pro→Flash 双层路由。


设计理念

为什么需要 Auto-Coding

把"写代码"这件事交给 AI,最大的问题不是 AI 不会写,而是AI 写了就忘了

  • 写完不测试,或者测试只走 happy path
  • 改 A 模块时顺手重构了 B 模块,引入新 bug
  • 做了需求没说的"额外功能",过度设计
  • 没有 review 自己代码的习惯,低级错误反复出现

Auto-Coding 的本质是用结构化流程替代人类的代码纪律。不是"让 AI 写得更好",而是"让 AI 像有经验的工程师一样工作":先设计后编码、测试驱动、自己审查自己、迭代修改、验证交付。每一个阶段都是独立子 Agent,换模型、换人格、换思维方式,模拟代码评审的对抗效果。

核心设计原则

  1. 全子代理化 — 每个阶段独立 sessions_spawn,主会话只做监工
  2. 分阶段技能注入 — 每阶段 ≤2 个技能文件,不撑爆上下文
  3. Pro→Flash 分层路由 — 推理/设计/审查用 Pro,编码/执行/验证用 Flash,成本节省 ~50%
  4. 量化防御 — Risk Scorecard 五元组 + 冷却窗口,自动检测反模式
  5. 自动推进不中断 — 只在需求不明确、多方案需选择、安全审批时暂停

8 步循环流程

设计 → 分解 → 编码 → 测试 → 反思 → 优化 → 验证 → 输出
  ↑_______________________________________↓
              迭代 (最多 3 次)
步骤 阶段 注入技能 默认模型 核心职责
1 设计 grill-with-docs Pro 需求对齐、反推缺失上下文、技术方案选型
2 分解 decomposition Pro 任务原子化、依赖排序、Done 标准定义
3 编码 tdd Flash TDD 红-绿-重构循环、垂直切片
4 测试 testing Flash 边界覆盖、回归检测、异常路径
5 反思 zoom-out + code-review Pro 全局视角审查、🔴🟡💭 分级、否决权
6 优化 optimize Pro 推理重构、性能优化、Karpathy 极简检查
7 验证 verification Flash 交付验证清单、契约一致性自检
8 输出 交付物聚合、变更摘要

复杂度自动分级

等级 特征 执行阶段 典型耗时
A (Micro) 单函数、Bug 修复 编码→测试→验证 (3) <2 分钟
B (Feature) 模块开发、单 API 设计→编码→测试→验证 (4) 2-5 分钟
C (System) 完整系统、多文件重构 完整 7 阶段 5-15 分钟

架构设计

┌─────────────────────────────────────────────────────────────────┐
│                  AutoCodingWorkflowEnhanced                     │
├─────────────────────────────────────────────────────────────────┤
│  Complexity   │  Skill Injector  │  Model Auto    │  Task        │
│  Analyzer     │  (12 技能)       │  Router        │  Profiler    │
│  (ABC 分级)   │                  │  (Pro→Flash)   │  (窗口校准)   │
├───────────────┼──────────────────┼────────────────┼──────────────┤
│  Scorecard    │  Approval Rules  │  State Manager │  Reviewer     │
│  Engine       │  (YAML 配置)     │  (断点续传)     │  Worker       │
│  (五元组检测)  │                  │                │  (否决权)     │
└─────────────────────────────────────────────────────────────────┘

Model Auto Router — Pro→Flash 双层路由

三层决策机制:阶段路由表 → 任务类型覆盖 → 上下文阈值门控。

  • Pro 做"大脑":设计、分解、反思(审查)、优化(重构)
  • Flash 做"手":编码、测试、验证(执行写入)
  • 例外覆盖:集成修改 → 升回 Pro;>50k token → Pro(1M 窗口优势)
  • 成本节省:~50%(vs 全 Pro)

Skill Injector — 分阶段技能注入

12 个独立技能文件,按阶段精确注入,每阶段 ≤2 个。降级策略:技能文件缺失 → 跳过、记录警告、不阻塞流程。

Risk Scorecard 引擎

五元组检测模型,每阶段执行后自动扫描:

维度 信号示例 默认阈值
完整性 testing_phase_executed == false 🔴 阻塞
一致性 modified_file_count > expected_file_count 🟡 警告
安全性 hardcoded_secret_detected 🔴 阻塞
简洁性 extra_features_added > 0 🟡 警告
流程纪律 zoom_out_executed == false and modified_file_count > 3 🟡 警告

冷却窗口:同一类失败 24h 内第 3 次 → 静默,防告警疲劳。

Task Profiler — 动态窗口校准

记录每次子 Agent 实际耗时,按 category/model/phase 计算校准系数:

窗口 = 静态预估 × adjust_factor × model_factor × risk_buffer

Reviewer 否决权

  • 🔴 阻塞项: 安全漏洞、不符合需求、过度设计 → 必须重写
  • 🟡 警告项: 缺少测试、命名不规范 → 建议修改
  • 💭 观察项: 风格偏好 → 记录不阻塞

最多 3 次迭代,第 3 次仍阻塞 → 标记失败、保留最后代码。


技能文件体系

技能文件 注入阶段 职责
grill-with-docs 设计 需求对齐、结构化追问、CONTEXT.md 维护
decomposition 分解 任务原子化、依赖分析、粒度检查
tdd 编码 TDD 红-绿-重构循环、垂直切片规则
testing 测试 测试策略、边界覆盖、回归检测
zoom-out 反思 全局视角、跨模块依赖分析
code-review 反思 🔴🟡💭 分级审查、否决权
optimize 优化 重构纪律、性能优化检查清单
verification 验证 交付验证清单、契约一致性自检
diagnose 调试子流程 6 阶段系统化调试
improve-architecture 架构检查 架构健康检查、深层耦合发现
risk-scorecard 全局 五元组检测、信号定义、阈值规则
discipline-meta 全局 元规则、量化上限、override 流程

容错与降级

场景 策略
技能文件缺失 跳过、记录警告、继续执行
模型不可用 同层降级 → 跨层降级
子 Agent 超时 重试 2 次
审查连续 2 次阻塞 自动升级复杂度 → 重新设计
第 3 次迭代仍阻塞 标记失败、保留代码、报告用户
session 中断 从 state.json 恢复、跳过已完成阶段

Karpathy 铁律

  1. 思考优先: 不假设,模糊需求列出假设或直接提问
  2. 极简主义: 最少代码解决,自检"200 行能否缩到 50 行"
  3. 手术刀修改: 只改必须改的,不顺手重构,遵循现有风格
  4. 目标导向: 先定义 Done 标准再编码,验证通过才算完成
  5. TDD 纪律: 先写测试(红)→ 实现(绿)→ 重构,不跳过

快速开始

环境要求

  • OpenClaw 2026.5.7+
  • deepseek-v4-proMiMo v2.5 Pro provider 已配置
openclaw --version
openclaw models list

基本使用

from workflow_enhanced import AutoCodingWorkflowEnhanced

workflow = AutoCodingWorkflowEnhanced(
    requirements="实现用户登录功能",
    project_dir="./my-project",
    resume=True,
)
await workflow.run()

触发词

auto-coding | 写代码 | 开发 | coding | karpathy | 自动编码 | 自主编码


v3.7 vs v3.6

维度 v3.6 v3.7
架构 单进程串行、多角色 Prompt 全子代理架构、每阶段独立 Agent
模型路由 阶段硬编码 Pro→Flash 双层自动路由
防御机制 三重防错自检 Risk Scorecard 五元组 + 冷却窗口
技能注入 内嵌 8 个 Agent Soul 12 独立技能文件、按阶段注入
超时控制 固定超时 Task Profiler 动态校准
Reviewer 审查无否决权 独立 Worker + 阻塞强制重写

👤 作者

Kris Lu krislu666@foxmail.com

📄 许可

MIT License


Auto-Coding v3.7.0 · 2026-05-23

About

Auto-Coding 是一个智能自主编码系统,通过多 Agent 协作完成从需求到代码的完整开发流程。 核心理念: 不是任务分发器,而是自我完善的智能编程系统。它利用 OpenClaw 的多子 Agent 进程,进行设计→分解→编码→测试→反思→优化→验证→输出,分不同角色的 Prompt 实现多维度的自我审查和自我优化,提升代码可执行率。适合复杂项目,但会消耗更多的 Token,应谨慎使用。 推荐使用: Claw RoundTable 先进行多 Agent 项目研讨和方案完善,然后将结论送入 Auto-Coding 进行编码,效果更好。 agent人格借鉴了Agency-Agent关于程序员的部分,特此致敬

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages