From 70aea7f96144a4714a6b0db3738dcb2d5bd0b0c7 Mon Sep 17 00:00:00 2001 From: Thalia325 Date: Sat, 23 May 2026 16:13:24 +0800 Subject: [PATCH 1/3] Add weekly report for Thalia325 from 2026.5.12 to 2026.5.26 --- [WeeklyReport] Thalia325 2026.5.12~2026.5.26 | 31 ++++++++++++++++++++ 1 file changed, 31 insertions(+) create mode 100644 [WeeklyReport] Thalia325 2026.5.12~2026.5.26 diff --git a/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 b/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 new file mode 100644 index 00000000..fd9bccea --- /dev/null +++ b/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 @@ -0,0 +1,31 @@ +### 姓名 + +龙小羽 + +### 实习项目 + +PaddleOCR+ERNIE 应用创新赛道 +careerpilot-职路领航 + +### 本周工作 + +1. **任务 ** + + - 添加 Scheduler 调度任务可能重复执行,使用数据库锁或 Redis lock;执行前设置 `locked_until/running`;任务记录 execution id 并保证幂等 + - 修正MinIO 配置缺失时没有生产强校验 + +2. **任务 项目推文** + + - CareerPilot 如何用 PaddleOCR 打造职业规划的“第一道防线” https://mp.weixin.qq.com/s/p9_MFDV_4Vj_gBkik8ekXA + - 从 Mock 到 PaddleOCR Provider https://mp.weixin.qq.com/s/L281BYmGr4LtQyPU9OpZDw + + +### 下周工作 + +1. 添加 Scheduler 调度任务可能重复执行,使用数据库锁或 Redis lock;执行前设置 `locked_until/running`;任务记录 execution id 并保证幂等 +2. 修正MinIO 配置缺失时没有生产强校验 +3. 项目上线部署 + +### 导师点评 + +请联系导师填写 From b9ecfa17a1f6e5c4551bf94bfbfd367d5a22460a Mon Sep 17 00:00:00 2001 From: Thalia325 Date: Sat, 23 May 2026 16:23:29 +0800 Subject: [PATCH 2/3] Update [WeeklyReport] Thalia325 2026.5.12~2026.5.26 --- [WeeklyReport] Thalia325 2026.5.12~2026.5.26 | 11 ++++++----- 1 file changed, 6 insertions(+), 5 deletions(-) diff --git a/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 b/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 index fd9bccea..defa6c29 100644 --- a/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 +++ b/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 @@ -10,9 +10,10 @@ careerpilot-职路领航 ### 本周工作 1. **任务 ** - + - 上线准备,前端后端打包至服务器,准备 备案材料。 - 添加 Scheduler 调度任务可能重复执行,使用数据库锁或 Redis lock;执行前设置 `locked_until/running`;任务记录 execution id 并保证幂等 - 修正MinIO 配置缺失时没有生产强校验 + - 增加 healthcheck、restart policy、mem_limit 或 deploy resources;后端 depends_on 应等待服务健康,而不只是容器启动。修正Docker Compose 缺少资源限制和健康检查 2. **任务 项目推文** @@ -22,10 +23,10 @@ careerpilot-职路领航 ### 下周工作 -1. 添加 Scheduler 调度任务可能重复执行,使用数据库锁或 Redis lock;执行前设置 `locked_until/running`;任务记录 execution id 并保证幂等 -2. 修正MinIO 配置缺失时没有生产强校验 -3. 项目上线部署 - +1. 扩展_normalize_layout_parsing_result()以处理观察到的 PaddleOCR 响应形状 +2. 添加一种感知提供商的文档处理策略:对于 DOCX:在本地提取文本并进行raw_text规范化,或者在 OCR 之前转换为 PDF/图像。对于 DOC:要么转换,要么拒绝,并给出清晰的前端/后端验证消息。 +3. 修复pytest从普通模式运行backend/失败 ### 导师点评 请联系导师填写 + From 9fcc81db7f28f1100b6aff5d8c1e66a90f084ead Mon Sep 17 00:00:00 2001 From: Thalia325 Date: Tue, 26 May 2026 20:32:57 +0800 Subject: [PATCH 3/3] Revise project tweets and add new links Updated project tweets and added new links related to CareerPilot and PaddleOCR. --- [WeeklyReport] Thalia325 2026.5.12~2026.5.26 | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 b/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 index defa6c29..5275b3ad 100644 --- a/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 +++ b/[WeeklyReport] Thalia325 2026.5.12~2026.5.26 @@ -17,8 +17,8 @@ careerpilot-职路领航 2. **任务 项目推文** - - CareerPilot 如何用 PaddleOCR 打造职业规划的“第一道防线” https://mp.weixin.qq.com/s/p9_MFDV_4Vj_gBkik8ekXA - - 从 Mock 到 PaddleOCR Provider https://mp.weixin.qq.com/s/L281BYmGr4LtQyPU9OpZDw + - 学生上传 PDF 后 ,CareerPilot Agent 如何调用 PaddleOCR? https://mp.weixin.qq.com/s/qMCrE6ZBcZwZNahvmvNnoA + - PaddleOCR 识别出文字就够了吗?CareerPilot 真正需要的是结构化数据 https://mp.weixin.qq.com/s/Hd6zUOPJDX09hRBEVgByYA ### 下周工作