Skip to content

请教 WeDetect-Base 在 A100 上的测速设置(与论文速度有差异) #20

@LitYan

Description

@LitYan

作者您好,感谢开源 WeDetect!

我在 A100 上复现 WeDetect-Base 的推理速度时,结果比论文里看到的速度慢一些,想请教下是否是我设置和你们不一致。

我这边的测试信息(640x640):

  • 配置:config/wedetect_base.py
  • GPU:A100
  • Latency(mean):44.398 ms
  • FPS:22.52
  • 其中模块耗时大致为:vision 23.009 ms,text 12.320 ms,neck 6.547 ms,head 2.349 ms

想向您确认两点即可:

  1. 论文测速时是否使用了 reparameterize(缓存文本特征)?
  2. 论文中的测速主要是在什么 GPU 和精度设置下完成的(例如是否 AMP)?

如果方便的话,我再按你们的设置重新对齐测试。非常感谢!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions