请教 WeDetect-Base 在 A100 上的测速设置（与论文速度有差异）

作者您好，感谢开源 WeDetect！

我在 A100 上复现 WeDetect-Base 的推理速度时，结果比论文里看到的速度慢一些，想请教下是否是我设置和你们不一致。

我这边的测试信息（640x640）：
- 配置：`config/wedetect_base.py`
- GPU：A100
- Latency(mean)：44.398 ms
- FPS：22.52
- 其中模块耗时大致为：vision 23.009 ms，text 12.320 ms，neck 6.547 ms，head 2.349 ms

想向您确认两点即可：
1. 论文测速时是否使用了 `reparameterize`（缓存文本特征）？
2. 论文中的测速主要是在什么 GPU 和精度设置下完成的（例如是否 AMP）？

如果方便的话，我再按你们的设置重新对齐测试。非常感谢！