Skip to content

chore: sync local code on 2026-06-08#133

Open
yzj-hsz wants to merge 1 commit into
xiaozhejiya:mainfrom
wyh16:chore/sync-local-code-20260608
Open

chore: sync local code on 2026-06-08#133
yzj-hsz wants to merge 1 commit into
xiaozhejiya:mainfrom
wyh16:chore/sync-local-code-20260608

Conversation

@yzj-hsz

@yzj-hsz yzj-hsz commented Jun 9, 2026

Copy link
Copy Markdown
Collaborator

Summary

  • 为错题库新增第一版 RAG 能力,增加 backend/core/rag.py,支持题干、选项、答案、用户作答、科目、题型、知识点标签的统一索引与语义检索
  • GET /api/error-bank/find 接入真实 embedding 检索,优先使用 RAG 语义召回;当 embedding 未配置或不可用时,自动降级到现有 hash 检索,保证接口可用性
  • 新增 POST /api/rag/reindex,支持按当前用户或项目重建错题 RAG 索引,便于历史数据补建和调试
  • 错题入库、题目编辑、答案更新、用户作答更新后自动刷新 RAG 索引,保证检索结果与最新内容同步
  • 新增 PostgreSQL / pgvector 兼容支持;在 PostgreSQL 下优先使用向量列与相似度查询,在 SQLite 下继续使用 JSON 向量存储与 Python 余弦相似度计算
  • 补充 RAG embedding 配置项与依赖,支持独立 embedding 凭据、复用 OpenAI provider,并兼容 base_url 场景
  • 新增 reindex_all.pybackend/check_pg.pybackend/benchmark/recall.py,分别用于全量重建索引、检查 pgvector 能力和做 Recall@K 离线评测
  • 补充 rag-development-plan.md,沉淀错题库与笔记 RAG 的阶段性设计、验收指标和后续扩展方向

Test plan

  • 新导入错题后自动建立 RAG 索引,新增题目可被语义检索召回
  • 编辑题目内容、答案和用户作答后,能够自动刷新对应索引
  • GET /api/error-bank/find 在 embedding 可用时返回语义检索结果,并包含合理的匹配分数与检索模式
  • embedding 未配置或调用失败时,接口自动降级到 hash 检索,查询流程不中断
  • POST /api/rag/reindex 可按用户 / 项目重建现有错题索引,并返回成功、跳过、失败统计
  • PostgreSQL 环境下可写入 pgvector 向量列并完成相似度查询;SQLite 环境下可正常使用本地余弦相似度检索
  • backend/benchmark/recall.py 可执行 Recall@K 评测,验证 RAG / hash 两种检索方式的召回效果

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant