Skip to content

334456777/weflow-rag

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

群聊检索库 · 使用

/weflow 下运行,命令统一用 .venv/bin/python

问答

在本目录打开 Claude Code,直接问群里的事(例:「群里关于失眠的讨论」「菠萝老师讲思维熵的核心观点」),它自动检索真实记录作答。

更新(群里有新消息后)

WeFlow 导出某时间段(选「JSON 详细格式」),然后传给 update:

.venv/bin/python update.py "导出文件.json"

自动去重、只加新消息、补向量,并打印读了哪个文件、新增多少条。

命令行检索

.venv/bin/python query.py <命令>
命令 作用
stats 概览:消息/人数/时间跨度/向量数
who [名字] 发言人及发言量
kw "词" 关键词精确(短词也行)
fts "词组" 全文检索(≥3 字)
sem "问题" 语义检索(找意思相近的)
ctx <id> [-n 6] 某条消息前后上下文
sql "SELECT ..." 只读 SQL
media <id> [-o 路径] 取出原图/原文档到文件

过滤器(kw/fts/sem 通用):--sender 名 --from 2026-01-01 --to 2026-03-01 --type 文本消息 -k 条数

.venv/bin/python query.py sem "大家怎么看失眠" -k 6
.venv/bin/python query.py kw "" --sender 菠萝777
.venv/bin/python query.py media 38

全量重建(一般用不到)

.venv/bin/python build.py "全量.json"

重建 chat.db + 向量 + assets.db/files.db(约 8 分钟)。

文件

  • chat.db — 文本 + 全文索引 + 向量 + 媒体元数据(问答/检索只用它)
  • assets.db 图片 · files.db 文档(BLOB,media 命令按需取)
  • build.py / update.py / query.py — 三个脚本(update/queryimport build

About

RAG检索工具

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors