作者您好,感谢开源 WeDetect!
我在 A100 上复现 WeDetect-Base 的推理速度时,结果比论文里看到的速度慢一些,想请教下是否是我设置和你们不一致。
我这边的测试信息(640x640):
- 配置:
config/wedetect_base.py
- GPU:A100
- Latency(mean):44.398 ms
- FPS:22.52
- 其中模块耗时大致为:vision 23.009 ms,text 12.320 ms,neck 6.547 ms,head 2.349 ms
想向您确认两点即可:
- 论文测速时是否使用了
reparameterize(缓存文本特征)?
- 论文中的测速主要是在什么 GPU 和精度设置下完成的(例如是否 AMP)?
如果方便的话,我再按你们的设置重新对齐测试。非常感谢!