Enterprise Support AI Copilot

企业内部知识库与工单 AgentOps 后端系统。

本项目最初由 FastAPI Todo / AI Todo API 演进而来，当前 main 分支已经升级为面向企业内部支持场景的 AI Copilot 后端项目。

当前系统已经完成 Enterprise RAG Core、Ticket CRUD、Ticket Agent preview / confirm、AgentOps 审计记录、Retrieval Logs / Metrics，以及 Document Backend MVP 闭环。项目重点从单纯知识库问答扩展为“知识检索 → 工单预览 → 人工确认 → 工单创建 → AgentOps 审计 → 文档生命周期管理”的企业支持 Copilot 后端。

当前版本定位：

Enterprise Support AI Copilot
├── Enterprise RAG Core
│   ├── 企业内部支持文档集
│   ├── 文档加载与切块
│   ├── embedding 批处理
│   ├── Chroma 向量库
│   ├── tenant/category metadata filter
│   ├── /rag/search
│   ├── /rag/ask
│   ├── answer + structured sources
│   ├── retrieval eval
│   ├── hit@1 / hit@3 / mrr@3
│   └── category breakdown
├── Document Backend
│   ├── /documents/upload
│   ├── /documents
│   ├── /documents/{document_id}
│   ├── /documents/{document_id}/index
│   ├── DELETE /documents/{document_id}
│   ├── documents / document_chunks
│   └── upload → index → search → delete lifecycle
├── Ticket CRUD
│   ├── create ticket
│   ├── list ticket
│   ├── get ticket
│   └── update ticket
├── Ticket Agent
│   ├── /agent/ticket/preview
│   ├── /agent/ticket/confirm
│   ├── TicketDraft
│   ├── TicketAgentSource
│   ├── approval ownership validation
│   ├── pending approval validation
│   └── draft payload consistency check
└── AgentOps
    ├── agent_runs
    ├── approval_requests
    ├── tool_calls
    ├── search_kb tool audit
    ├── classify_ticket tool audit
    ├── create_ticket tool audit
    ├── approval reject / cancel APIs
    └── AgentOps metrics summary API

1. 项目定位

本项目模拟企业内部支持场景。员工可以围绕 IT、HR、财务、行政、安全等内部制度和流程提出问题，系统基于企业知识库进行检索，并返回带来源依据的回答。

当前版本已扩展到工单处理场景：当用户问题更适合进入支持流程时，Ticket Agent 会生成工单预览，并通过人工确认后创建真实工单。系统同时记录 Agent 运行过程、工具调用输入输出、审批状态和基础运行指标。

核心链路如下：

企业内部文档 / 上传文档
↓
Document Backend 登记与生命周期管理
↓
文档加载与切块
↓
embedding
↓
Chroma vector store
↓
tenant/category 过滤检索
↓
RAG answer with sources
↓
Ticket Agent preview
↓
human approval
↓
create ticket
↓
tool_calls / agent_runs / approval_requests
↓
AgentOps metrics summary

当前项目由三层组成：

层级	模块	说明
知识访问层	Enterprise RAG Core	负责企业文档检索、引用来源返回、无依据拒答和 retrieval eval
文档管理层	Document Backend	负责 md/txt 上传、documents/document_chunks 登记、手动索引、Chroma 写入和删除下架
业务执行层	Ticket CRUD / Ticket Agent	负责工单创建、查询、更新，以及 preview / confirm 两阶段流程
审计观测层	AgentOps	负责记录 agent_runs、tool_calls、approval_requests 和 metrics summary

2. 当前阶段

当前阶段：Enterprise Support AI Copilot MVP

已完成能力：

模块	当前状态
FastAPI 基础后端	已完成
Todo CRUD	已保留，作为早期基础后端能力
AI Todo / LLM 调用	已保留，作为早期 LLM API 调用练习
RAG API	已完成 `/rag/search`、`/rag/ask`
企业文档集	已完成 10 份企业内部支持文档
文档分类	已支持 `it`、`hr`、`finance`、`admin`、`security`
文档 metadata	已支持 `tenant_id`、`category`
Chunk metadata	已支持 `tenant_id`、`category`
Chunk 策略	已针对企业长文档调优
Embedding	已支持分批请求
Vector store	使用 Chroma 持久化向量库
Metadata filter	已支持 tenant/category 过滤
API category filter	已支持 request.category + mock tenant context
Sources	RAG response 返回结构化来源信息
Retrieval eval	已支持 hit@1、hit@3、mrr@3、avg latency、category breakdown
Ticket CRUD	已完成 create / list / get / update
Ticket Agent	已完成 preview / confirm 两阶段流程
Human approval	已通过 approval_requests 表记录
Tool calls audit	已记录 search_kb / classify_ticket / create_ticket
AgentOps records	已支持 agent_runs / approval_requests / tool_calls
AgentOps 查询 API	已完成 MVP
Approval reject / cancel	已完成 MVP
AgentOps metrics summary	已完成 MVP
Retrieval logs / metrics	已完成 MVP，已支持日志明细、summary、sources、no-context queries 和 failures
Document Backend MVP	已完成 MVP，支持 md/txt 上传、文档登记、手动索引、Chroma 写入、删除后清理 embeddings
测试	RAG / Ticket / AgentOps / Document / Todo focused tests 均已覆盖

后续开发重点：

模块	状态
AgentRun latency / retrieval summary	已完成 MVP，后续补充时间窗口统计
Retrieval logs / metrics	已完成 MVP，已支持日志明细、summary、sources、no-context queries 和 failures
ToolCall 错误记录	已完成 MVP，后续细化 error_type
AgentOps dashboard / 时间窗口筛选	后续增强
Document Backend MVP	已完成 MVP，支持 md/txt 上传、文档登记、手动索引、Chroma 写入、删除后清理 embeddings
Docker Compose 本地运行	已完成安全版本地 Compose，端口仅绑定 127.0.0.1，并使用独立 docker_data / docker_storage / docker_chroma_db 目录
真实 tenant / user auth context	待开发
真实前端审批界面	待开发

3. AgentOps 当前能力

当前 Ticket Agent 的完整执行链路会产生三类记录：

agent_runs
tool_calls
approval_requests

一次成功的 preview / confirm 流程会产生：

1 条 agent_run
3 条 tool_call:
  - search_kb
  - classify_ticket
  - create_ticket
1 条 approval_request

search_kb

search_kb 记录知识库检索动作，包括：

query
top_k
tenant_id
category
results_count
document_ids
top_distance

classify_ticket

classify_ticket 记录工单判断动作，包括：

message
requested_category
sources_count
source_categories
source_document_ids
should_create_ticket
category
priority
reason

create_ticket

create_ticket 记录真实工单创建动作，包括：

title
description
category
priority
ticket_id
ticket status

AgentOps 审计增强

当前版本的 AgentOps 不只记录 Agent Run、Tool Call 和 Approval Request 的基础状态，还补充了更细的审计字段：

approval_requests.decision_reason：记录审批通过、拒绝或取消的原因。
tool_calls.error_type：记录工具调用失败类型，例如 search_kb_failed、classify_ticket_failed、create_ticket_failed。
metrics summary.tool_call_error_types：按失败类型统计 tool call，便于观察 Agent 执行链路中最常见的失败来源。

这使系统从“能记录执行结果”进一步升级为“能解释失败原因，并支持后续运维分析”。

4. Ticket Agent 安全边界

Ticket Agent 使用 preview / confirm 两阶段流程。

Preview 阶段只生成工单草稿和审批请求，不创建真实工单：

POST /agent/ticket/preview
↓
agent_run
↓
search_kb tool_call
↓
classify_ticket tool_call
↓
ticket draft
↓
approval_request.pending

Confirm 阶段在创建真实工单前会执行三类校验：

1. approval_request 必须属于当前 agent_run
2. approval_request.status 必须是 pending
3. confirm draft 必须与服务端保存的 approval_request.draft_json 一致

校验通过后，系统使用服务端保存的 draft 创建真实工单，并记录 create_ticket tool_call：

POST /agent/ticket/confirm
↓
approval validation
↓
draft consistency check
↓
approval_request.approved
↓
create_ticket tool_call
↓
ticket created

该设计用于避免重复确认、拒绝后执行、跨 agent_run 使用 approval_request，以及 confirm 阶段 payload 被修改的问题。

5. AgentOps API

当前 AgentOps 查询接口如下：

GET  /agent-ops/runs
GET  /agent-ops/runs/{agent_run_id}
GET  /agent-ops/runs/{agent_run_id}/tool-calls
GET  /agent-ops/runs/{agent_run_id}/approval-requests
GET  /agent-ops/metrics/summary

POST /agent-ops/approval-requests/{approval_request_id}/reject
POST /agent-ops/approval-requests/{approval_request_id}/cancel

/agent-ops/metrics/summary 示例：

{
  "total_agent_runs": 1,
  "running_agent_runs": 0,
  "completed_agent_runs": 1,
  "failed_agent_runs": 0,
  "cancelled_agent_runs": 0,
  "total_tool_calls": 3,
  "pending_tool_calls": 0,
  "successful_tool_calls": 3,
  "failed_tool_calls": 0,
  "total_approval_requests": 1,
  "pending_approval_requests": 0,
  "approved_approval_requests": 1,
  "rejected_approval_requests": 0,
  "cancelled_approval_requests": 0
}

6. 技术栈

类型	技术
Web 框架	FastAPI
数据校验	Pydantic
ORM / 数据库	SQLModel + SQLite
LLM / Embedding API	OpenAI-compatible SDK + DashScope / Bailian
Vector store	Chroma
测试	pytest + FastAPI TestClient
部署基础	Docker / Docker Compose
语言	Python

7. 当前项目结构

fastapi-todo-api/
├── main.py
├── database.py
├── models/
│   ├── ticket.py
│   ├── agent_ops.py
│   └── document.py
├── routers/
│   ├── rag.py
│   ├── tickets.py
│   ├── agent_ticket.py
│   ├── agent_ops.py
│   └── documents.py
├── schemas/
│   ├── rag.py
│   ├── ticket.py
│   ├── agent_ticket.py
│   ├── agent_ops.py
│   └── document.py
├── services/
│   ├── rag_service.py
│   ├── ticket_service.py
│   ├── ticket_agent_service.py
│   ├── agent_ops_service.py
│   └── document_service.py
├── experiments/
│   ├── docs/
│   │   ├── admin/
│   │   ├── finance/
│   │   ├── hr/
│   │   ├── it/
│   │   └── security/
│   ├── index/
│   ├── rag_local/
│   └── evals/
├── docs/
│   ├── project_summary.md
│   ├── architecture.md
│   ├── agent_workflow.md
│   ├── demo_script.md
│   ├── security.md
│   ├── rag_v0.1_report.md
│   ├── rag_core_v1_report.md
│   ├── ticket_crud_mvp_report.md
│   ├── ticket_agent_mvp_report.md
│   ├── retrieval_metrics.md
│   └── document_backend_mvp_report.md
├── tests/
│   ├── test_todos.py
│   ├── test_query_chroma.py
│   ├── test_rag_api.py
│   ├── test_rag_service.py
│   ├── test_document_models.py
│   ├── test_document_service.py
│   ├── test_document_api.py
│   ├── test_tickets.py
│   ├── test_agent_ops_service.py
│   ├── test_agent_ops_api.py
│   ├── test_ticket_agent_service.py
│   └── test_agent_ticket_api.py
├── scripts/
│   ├── smoke_agentops_flow.py
│   └── smoke_document_backend_flow.py
├── data/
├── Dockerfile
├── docker-compose.yml
├── requirements.txt
├── .env.example
├── AGENTS.md
└── README.md

8. 文档索引

文档	说明
`docs/project_summary.md`	项目成果总结，说明项目定位、解决问题、已完成能力、核心链路、验证方式、当前限制和后续计划
`docs/architecture.md`	系统总览架构文档，说明模块分层、数据存储、RAG / Document / Agent / AgentOps 请求链路、Docker 运行布局和 MVP 边界
`docs/agent_workflow.md`	Ticket Agent preview / confirm 流程、tool_calls 链路、AgentOps 查询方式
`docs/demo_script.md`	Swagger / API 手动演示脚本，用于展示 RAG、Ticket Agent、approval 和 metrics
`docs/security.md`	安全边界文档，说明 Ticket Agent、Document Backend、RAG tenant mock、Docker、本地密钥、成本和生产化限制
`docs/rag_core_v1_report.md`	Enterprise RAG Core 阶段报告
`docs/ticket_crud_mvp_report.md`	Ticket CRUD MVP 阶段报告
`docs/ticket_agent_mvp_report.md`	Ticket Agent MVP 阶段报告
`docs/retrieval_metrics.md`	Retrieval Logs / Metrics 阶段报告，说明 RAG 检索日志、summary、sources、no-context queries 和 failures 指标
`docs/document_backend_mvp_report.md`	Document Backend MVP 阶段报告，说明 md/txt 上传、documents/document_chunks 表、手动索引、Chroma 写入、删除与 RAG 检索联动

9. 环境变量

在项目根目录创建 .env 文件，并参考 .env.example 配置本地运行参数：

DASHSCOPE_API_KEY=your_dashscope_api_key_here
DASHSCOPE_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
DASHSCOPE_MODEL=qwen3.5-plus

10. 本地运行

安装依赖：

pip install -r requirements.txt

启动服务：

uvicorn main:app --reload

打开 Swagger 文档：

http://127.0.0.1:8000/docs

11. Docker Compose 本地运行

本项目支持使用 Docker Compose 启动 FastAPI 后端服务，适合本地 demo、功能验证和交付复现。

11.1 准备环境变量

项目根目录需要存在 .env 文件。可以从 .env.example 复制：

Copy-Item .env.example .env

然后在 .env 中配置真实模型参数：

DASHSCOPE_API_KEY=your_dashscope_api_key_here
DASHSCOPE_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
DASHSCOPE_MODEL=qwen3.5-plus
EMBEDDING_MODEL=text-embedding-v4

注意：.env 只用于本地运行，不应提交到 GitHub。

11.2 启动 Docker Desktop

Windows 环境下需要先启动 Docker Desktop，并确认 Docker Engine 正常运行：

docker info

11.3 检查 Compose 配置

docker compose config

如果配置正常，继续启动服务。

注意：docker compose config 会展开 .env 中的环境变量。不要把包含真实 API key 的完整输出粘贴到公开位置。

11.4 构建并启动服务

docker compose up --build

当前 Compose 配置只绑定本机地址：

127.0.0.1:8000

因此服务只会在本机可访问，不会直接暴露给局域网或公网。

11.5 验证服务

另开一个 PowerShell 窗口：

curl.exe http://127.0.0.1:8000/health

预期返回：

{"status":"ok"}

Swagger 地址：

http://127.0.0.1:8000/docs

11.6 Docker 运行数据目录

Docker Compose 使用独立的本地运行目录：

docker_data/
docker_storage/
docker_chroma_db/

对应容器内路径：

本地目录	容器内路径	用途
`docker_data/`	`/app/data`	SQLite 数据库
`docker_storage/`	`/app/storage`	上传文档
`docker_chroma_db/`	`/app/experiments/chroma_db`	Chroma 向量库

这样 Docker demo 数据不会污染本地开发数据目录。

这些目录已经加入 .gitignore，不应提交到 GitHub。

11.7 停止服务

前台运行时，在 docker compose up --build 窗口按：

Ctrl + C

也可以执行：

docker compose down

11.8 常见问题

端口 8000 被占用

如果启动时报错：

ports are not available

说明本机已有进程占用 127.0.0.1:8000，常见原因是本地 uvicorn main:app --reload 还在运行。

可以查看占用进程：

netstat -ano | findstr :8000

然后根据 PID 停止进程：

Stop-Process -Id <PID> -Force

再重新启动：

docker compose up --build

Chroma index 为空

Docker 使用独立目录 docker_chroma_db/，第一次运行时可能还没有 Chroma index。

可以在 Docker 环境中构建索引：

docker compose run --rm api python -m experiments.rag_local.build_chroma_index

然后重新启动服务：

docker compose up --build

12. Smoke Tests

本项目提供两类端到端 smoke script，用于在真实 FastAPI 服务启动后验证关键 API 链路。

Smoke script 与 pytest 的定位不同：

pytest:
验证 model / service / API 的单元或集成行为，通常使用 monkeypatch 隔离外部依赖。

smoke script:
调用真实运行中的 API 服务，验证 FastAPI、SQLite、Chroma、embedding 和业务链路能否串起来。

因此 smoke script 不放入 GitHub Actions 默认 CI。它们适合用于本地验收、Docker Compose 启动后验收，以及 demo 前快速确认系统可用。

运行 smoke script 前，需要先启动服务，并确保 .env 中配置了有效的模型 API key。

12.1 AgentOps Smoke Test

脚本：

python scripts/smoke_agentops_flow.py

该脚本验证 Ticket Agent 与 AgentOps 的完整 API 链路：

GET  /health
POST /agent/ticket/preview
GET  /agent-ops/runs/{agent_run_id}/tool-calls
GET  /agent-ops/runs/{agent_run_id}/approval-requests
POST /agent/ticket/confirm
GET  /agent-ops/runs/{agent_run_id}/tool-calls
GET  /agent-ops/metrics/summary

预期输出：

Smoke test passed.
Validated: preview -> search_kb/classify_ticket -> approval -> confirm -> create_ticket -> metrics

12.2 Document Backend Smoke Test

脚本：

python scripts/smoke_document_backend_flow.py

该脚本验证 Document Backend 与 RAG 的完整文档生命周期：

GET /health
↓
POST /documents/upload
↓
POST /documents/{document_id}/index
↓
POST /rag/search 确认上传文档可检索
↓
DELETE /documents/{document_id}
↓
POST /rag/search 确认删除文档不再返回

该脚本会触发真实 embedding 调用，需要 .env 中存在有效的：

DASHSCOPE_API_KEY=your_dashscope_api_key_here
DASHSCOPE_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
EMBEDDING_MODEL=text-embedding-v4

预期输出：

Smoke test passed.
Validated: health -> upload -> index -> search hit -> delete -> search miss

12.3 本地运行方式

先启动本地服务：

uvicorn main:app --reload

另开一个终端运行：

python scripts/smoke_agentops_flow.py
python scripts/smoke_document_backend_flow.py

如需指定 API 地址，Windows PowerShell 可以写成：

$env:API_BASE_URL="http://127.0.0.1:8000"
python scripts/smoke_agentops_flow.py
python scripts/smoke_document_backend_flow.py

12.4 Docker Compose 运行方式

先启动 Docker 服务：

docker compose up --build

另开一个 PowerShell 窗口确认服务可访问：

curl.exe http://127.0.0.1:8000/health

然后在宿主机运行 smoke scripts：

$env:API_BASE_URL="http://127.0.0.1:8000"
python scripts/smoke_agentops_flow.py
python scripts/smoke_document_backend_flow.py

注意：Docker Compose 使用独立的 docker_data/、docker_storage/ 和 docker_chroma_db/ 目录，因此 Docker 环境下的 smoke 数据不会污染本地开发数据目录。

13. 构建 Chroma 向量索引

当前企业文档位于：

experiments/docs/

构建 Chroma index：

python -m experiments.rag_local.build_chroma_index

当前企业文档集构建结果：

Loaded documents: 10
Generated chunks: 40
Generated embeddings: 40
Collection count: 40

14. RAG 检索命令示例

IT 类问题

python -m experiments.rag_local.query_chroma "VPN 连不上应该先检查什么？" --top-k 3 --tenant-id tenant_demo --category it

HR 类问题

python -m experiments.rag_local.query_chroma "请假需要在系统里提交吗？" --top-k 3 --tenant-id tenant_demo --category hr

财务类问题

python -m experiments.rag_local.query_chroma "差旅报销需要哪些材料？" --top-k 3 --tenant-id tenant_demo --category finance

行政类问题

python -m experiments.rag_local.query_chroma "会议室临时不用需要释放吗？" --top-k 3 --tenant-id tenant_demo --category admin

安全类问题

python -m experiments.rag_local.query_chroma "外包人员可以共用账号吗？" --top-k 3 --tenant-id tenant_demo --category security

15. RAG API

POST `/rag/search`

功能：基于 Chroma 向量库执行 top-k 检索，支持 category filter。

请求示例：

{
  "query": "VPN 连不上应该先检查什么？",
  "top_k": 3,
  "category": "it"
}

字段说明：

字段	含义
`query`	用户问题
`top_k`	返回的检索结果数量
`category`	可选分类过滤，例如 `it`、`hr`、`finance`、`admin`、`security`

当前 API 层只暴露 category filter。tenant_id 暂时由系统内部 mock tenant context 提供：

tenant_demo

后续接入登录系统后，tenant_id 将从当前用户身份中获取。

响应字段：

字段	含义
`document_id`	来源文档 ID
`chunk_id`	命中的 chunk ID
`title`	文档标题
`source_path`	文档路径
`chunk_index`	chunk 在文档中的顺序
`distance`	向量距离
`preview`	chunk 内容预览
`tenant_id`	来源租户
`category`	来源分类

POST `/rag/ask`

功能：执行完整 RAG 流程，包括 Chroma 检索、上下文构造、LLM 回答生成和 sources 返回。

请求示例：

{
  "question": "VPN 连不上应该先检查什么？",
  "top_k": 3,
  "max_distance": 0.9,
  "category": "it"
}

响应字段：

字段	含义
`answer`	基于检索上下文生成的回答
`retrieval_status`	检索状态
`top_distance`	top1 检索结果距离
`sources`	回答引用的来源 chunk 列表

当检索不到足够相关内容时，系统返回拒答：

我在已提供资料中没有找到足够依据。

16. Document Backend API

Document Backend 负责把上传文档纳入后端知识库生命周期管理。当前支持 md/txt 文件上传、文档登记、手动索引、Chroma 写入和删除下架。

POST `/documents/upload`

功能：上传 md/txt 文档，保存到本地 storage，并写入 documents 表。

请求类型：

multipart/form-data

字段：

字段	含义
`file`	上传的 `.md` 或 `.txt` 文件
`category`	文档分类，例如 `it`、`hr`、`finance`、`admin`、`security`、`other`

上传成功后：

documents.status = uploaded
chunk_count = 0

这表示文档已经进入后端系统，但还没有进入向量库。

GET `/documents`

功能：查询当前 tenant 下的文档列表。

支持过滤：

category
status
limit
offset

默认不返回 deleted 文档。

GET `/documents/{document_id}`

功能：查询单个文档的 metadata 和当前状态。

该接口只读，不会触发索引，也不会改变数据库状态。

POST `/documents/{document_id}/index`

功能：触发文档索引。

索引流程：

读取 source_path
↓
切分 chunk
↓
生成 embedding
↓
写入 Chroma
↓
写入 document_chunks
↓
documents.status = indexed

索引成功后，上传文档可以被 /rag/search 和 /rag/ask 检索到。

DELETE `/documents/{document_id}`

功能：下架文档。

删除流程：

读取 document_chunks.embedding_id
↓
删除 Chroma embeddings
↓
清理 document_chunks
↓
documents.status = deleted

删除后，GET /documents/{document_id} 返回 404，后续 RAG 检索不再返回该文档。

17. 当前 API 分层

POST /rag/search
→ routers/rag.py::rag_search()
→ services/rag_service.py::search_documents()
→ experiments/rag_local/query_chroma.py::search_chroma()

POST /rag/ask
→ routers/rag.py::rag_ask()
→ services/rag_service.py::answer_question()
→ experiments/rag_local/query_rag_chroma.py::ask_rag()

POST /documents/upload
→ routers/documents.py::upload_document()
→ services/document_service.py::create_document_from_bytes()
→ models/document.py::Document

POST /documents/{document_id}/index
→ routers/documents.py::index_document()
→ services/document_service.py::index_document()
→ experiments/rag_local/text_splitter.py::split_text()
→ Chroma collection.add()
→ models/document.py::DocumentChunk

DELETE /documents/{document_id}
→ routers/documents.py::delete_document()
→ services/document_service.py::delete_document()
→ Chroma collection.delete()
→ documents.status = deleted

各层职责：

层	职责
`routers/rag.py`	处理 RAG HTTP 请求、调用 service、组装 API response
`routers/documents.py`	处理文档上传、列表、读取、索引和删除 HTTP 请求
`schemas/rag.py`	定义 RAG request / response schema
`schemas/document.py`	定义 Document Backend response schema
`services/rag_service.py`	提供 RAG 业务入口
`services/document_service.py`	提供文档保存、查询、索引、删除和 Chroma 写入逻辑
`models/document.py`	定义 documents / document_chunks 表
`experiments/rag_local/`	执行底层 RAG、Chroma、embedding、LLM 和文本切分逻辑
`tests/`	验证 API 层和 service 层行为

18. 测试

运行测试：

pytest tests/test_query_chroma.py
pytest tests/test_rag_api.py
pytest tests/test_rag_service.py
pytest tests/test_document_models.py
pytest tests/test_document_service.py
pytest tests/test_document_api.py
pytest tests/test_todos.py
pytest tests/test_tickets.py
pytest tests/test_agent_ops_service.py
pytest tests/test_agent_ops_api.py
pytest tests/test_ticket_agent_service.py
pytest tests/test_agent_ticket_api.py

当前结果：

RAG / Document / Ticket / AgentOps / Todo focused test suites are passing.

测试覆盖：

文件	覆盖内容
`tests/test_todos.py`	Todo 基础 CRUD 和请求校验
`tests/test_query_chroma.py`	Chroma metadata filter
`tests/test_rag_api.py`	RAG API happy path、validation、service error
`tests/test_rag_service.py`	RAG service 层参数透传和下游调用
`tests/test_document_models.py`	Document / DocumentChunk model 和 DocumentResponse schema
`tests/test_document_service.py`	Document service 的上传、列表、读取、索引、删除和 tenant 隔离
`tests/test_document_api.py`	Document API 的上传、列表、读取、索引和删除
`tests/test_tickets.py`	Ticket CRUD
`tests/test_agent_ops_service.py`	AgentRun / ToolCall / ApprovalRequest service + metrics summary
`tests/test_agent_ops_api.py`	AgentOps read API + approval reject / cancel API + metrics summary API
`tests/test_ticket_agent_service.py`	Ticket Agent preview / confirm / AgentOps 轨迹
`tests/test_agent_ticket_api.py`	Ticket Agent API request / response / validation

RAG 测试使用 monkeypatch 隔离真实 Chroma、embedding 和 LLM 调用，因此不会消耗 token。

19. 当前版本记录

Version	Documents	Categories	Chunks	Vector Store	Eval
RAG v0.1 learning-doc baseline	5	general	5	JSON / Chroma	15 条 learning eval
Enterprise RAG Core	10	it / hr / finance / admin / security	40	Chroma	30 条 enterprise eval
Ticket Agent MVP	10	it / hr / finance / admin / security	40	Chroma + SQLite	preview / confirm / AgentOps tests
Document Backend MVP	10 + uploaded docs	it / hr / finance / admin / security / other	40 + uploaded chunks	Chroma + SQLite	upload / index / search / delete lifecycle

旧 learning-doc baseline 的 eval 结果：

Retriever	hit@1	hit@3	top1 miss cases	failed cases
JSON cosine index	0.93	1.00	1	0
Chroma	0.93	1.00	1	0

旧 eval 基于 FastAPI、Docker、Embedding、RAG、SQLModel 学习文档，主要用于记录早期 RAG 学习阶段的 baseline。当前企业文档集会使用新的 enterprise RAG eval 进行评测。

企业 Chroma eval 当前结果：

Metric	Result
Total	30
hit@1	0.97
hit@3	1.00
mrr@3	0.98

当前唯一主要 top1 miss 是 finance 场景中 `doc_travel_reimbursement` 与 `doc_invoice_rules` 的边界问题，属于业务文档语义重叠，不是检索链路故障。

20. 下一步计划

短期下一步：

Final review and optional polish

计划包括：

保持 README / project_summary / architecture / security / demo_script / smoke scripts 与当前实现同步。
检查最终文档、测试、Docker Compose 和 smoke scripts 是否可复现。
保留 AgentOps dashboard / 时间窗口筛选作为后续增强。
保留真实 tenant / user auth context 作为后续增强。

中期计划：

indexing job logs。
文档版本管理。
PDF / Word 等复杂文档解析。
真实 tenant / user auth context。
AgentOps dashboard。
Docker Compose 最终部署版。

最终目标：企业内部知识库 RAG + Document Backend + 受控 Ticket Agent + AgentOps 审计与评测

21. 项目说明

仓库名保留为 fastapi-todo-api，因为项目最初从 FastAPI Todo API 开始演进。当前 main 分支是 Enterprise Support AI Copilot 的主开发分支。

当前 main 分支已经完成 Enterprise RAG Core v1、Ticket CRUD MVP、Ticket Agent MVP、AgentOps read API、Retrieval Logs / Metrics、Document Backend MVP、Docker Compose 本地运行、Document Backend smoke test、approval reject / cancel API 和 AgentOps metrics summary API。后续可以继续推进最终检查、真实 tenant / user auth context、真实前端审批界面、AgentOps dashboard / 时间窗口筛选和文档版本管理。

Name		Name	Last commit message	Last commit date
Latest commit History 152 Commits
.github/workflows		.github/workflows
.vscode		.vscode
docs		docs
experiments		experiments
models		models
routers		routers
schemas		schemas
scripts		scripts
services		services
tests		tests
.dockerignore		.dockerignore
.env.example		.env.example
.gitattributes		.gitattributes
.gitignore		.gitignore
AGENTS.md		AGENTS.md
Dockerfile		Dockerfile
README.md		README.md
database.py		database.py
docker-compose.yml		docker-compose.yml
main.py		main.py
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Enterprise Support AI Copilot

1. 项目定位

2. 当前阶段

3. AgentOps 当前能力

search_kb

classify_ticket

create_ticket

AgentOps 审计增强

4. Ticket Agent 安全边界

5. AgentOps API

6. 技术栈

7. 当前项目结构

8. 文档索引

9. 环境变量

10. 本地运行

11. Docker Compose 本地运行

11.1 准备环境变量

11.2 启动 Docker Desktop

11.3 检查 Compose 配置

11.4 构建并启动服务

11.5 验证服务

11.6 Docker 运行数据目录

11.7 停止服务

11.8 常见问题

端口 8000 被占用

Chroma index 为空

12. Smoke Tests

12.1 AgentOps Smoke Test

12.2 Document Backend Smoke Test

12.3 本地运行方式

12.4 Docker Compose 运行方式

13. 构建 Chroma 向量索引

14. RAG 检索命令示例

IT 类问题

HR 类问题

财务类问题

行政类问题

安全类问题

15. RAG API

POST /rag/search

POST /rag/ask

16. Document Backend API

POST /documents/upload

GET /documents

GET /documents/{document_id}

POST /documents/{document_id}/index

DELETE /documents/{document_id}

17. 当前 API 分层

18. 测试

19. 当前版本记录

当前唯一主要 top1 miss 是 finance 场景中 doc_travel_reimbursement 与 doc_invoice_rules 的边界问题，属于业务文档语义重叠，不是检索链路故障。

20. 下一步计划

最终目标： 企业内部知识库 RAG + Document Backend + 受控 Ticket Agent + AgentOps 审计与评测

21. 项目说明

About

Topics

Resources

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

POST `/rag/search`

POST `/rag/ask`

POST `/documents/upload`

GET `/documents`

GET `/documents/{document_id}`

POST `/documents/{document_id}/index`

DELETE `/documents/{document_id}`

当前唯一主要 top1 miss 是 finance 场景中 `doc_travel_reimbursement` 与 `doc_invoice_rules` 的边界问题，属于业务文档语义重叠，不是检索链路故障。

最终目标：企业内部知识库 RAG + Document Backend + 受控 Ticket Agent + AgentOps 审计与评测

Packages