ProtoDINO: Cross-Domain Few-Shot Object Detection via GroundingDINO and CLIP-Based Prototypes

本仓库是 NTIRE 2025 CD-FSOD Challenge - ProtoDINO: Cross-Domain Few-Shot Object Detection via GroundingDINO and CLIP-Based Prototypes 的官方实现。

为了增强基准模型目标分类的能力，ProtoDINO基于开放集目标检测模型GroundingDINO, 引入CLIP模型在少量目标域样本上提取图像局部特征和全局特征作支持集，并分别构建局部原型和全局原型网络。在目标检测过程中，对每一个图像查询，我们使用CLIP提取视觉特征，计算其与局部原型和全局原型的L2距离，并把该距离作为目标分类的指标之一；此外，我们引入CLIP模型进行分类；我们还引入car-damage-detection 模型，这是一个基于ViT实现的车辆外观损伤分类模型。在目标分类中，我们将grounding_dino、CLIP、car-damage-detection以及原型网络匹配概率加权求和，作为分类指标。

我们在Grounding_DINO_FineTuning仓库的基础上改进得到了当前代码。本仓库基于Python 3.10和CUDA 12.2构建。

模型权重

grounding_dino权重下载

wget -q https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth

CLIP实现采用了DFN5B-CLIP-ViT-H-14-378，下载模型请使用

git lfs clone https://huggingface.co/apple/DFN5B-CLIP-ViT-H-14-378

car-damage-detector模型下载模型请运行

git lfs clone https://huggingface.co/beingamit99/car_damage_detection

数据集

首先应准备数据集，并按图中安排目录结构。将COCO格式的数据放在datasets下。本项目使用数据集可以通过Datasets on Google Drive 获取。

在项目代码中，应确保权重和模型文件路径正确：

ProtoDINO/configs下修改配置文件，在train_config和test_config中应注意修改weights_path和config_path的路径
在get_centroid_new.py 和 get_result_prototype_new.py中，应确定CLIP和car-damage-detection的模型路径正确

运行项目

本项目运行分为两个阶段，原型构建和目标检测。

关于原型构建阶段，我们已经生成了原型的pkl文件在项目中。想要重新构建原型，请运行python get_centroid_new.py,

目标检测阶段，运行python get_result_prototype_new.py获取目标检测结果，生成结果会保存在results目录中

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.asset		.asset
configs		configs
demo		demo
groundingdino		groundingdino
misc		misc
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
baseline.py		baseline.py
car.py		car.py
config.py		config.py
dataset1_10_shot_centroids.pkl		dataset1_10_shot_centroids.pkl
dataset1_10_shot_centroids_global.pkl		dataset1_10_shot_centroids_global.pkl
dataset1_1_shot_centroids.pkl		dataset1_1_shot_centroids.pkl
dataset1_1_shot_centroids_global.pkl		dataset1_1_shot_centroids_global.pkl
dataset1_5_shot_centroids.pkl		dataset1_5_shot_centroids.pkl
dataset1_5_shot_centroids_global.pkl		dataset1_5_shot_centroids_global.pkl
dataset2_10_shot_centroids.pkl		dataset2_10_shot_centroids.pkl
dataset2_10_shot_centroids_global.pkl		dataset2_10_shot_centroids_global.pkl
dataset2_1_shot_centroids.pkl		dataset2_1_shot_centroids.pkl
dataset2_1_shot_centroids_global.pkl		dataset2_1_shot_centroids_global.pkl
dataset2_5_shot_centroids.pkl		dataset2_5_shot_centroids.pkl
dataset2_5_shot_centroids_global.pkl		dataset2_5_shot_centroids_global.pkl
dataset3_10_shot_centroids.pkl		dataset3_10_shot_centroids.pkl
dataset3_10_shot_centroids_global.pkl		dataset3_10_shot_centroids_global.pkl
dataset3_1_shot_centroids.pkl		dataset3_1_shot_centroids.pkl
dataset3_1_shot_centroids_global.pkl		dataset3_1_shot_centroids_global.pkl
dataset3_5_shot_centroids.pkl		dataset3_5_shot_centroids.pkl
dataset3_5_shot_centroids_global.pkl		dataset3_5_shot_centroids_global.pkl
get_centroid.py		get_centroid.py
get_centroid_new.py		get_centroid_new.py
get_result.py		get_result.py
get_result_prototype.py		get_result_prototype.py
get_result_prototype_new.py		get_result_prototype_new.py
get_result_qwen.py		get_result_qwen.py
image_process.py		image_process.py
output_image.jpg		output_image.jpg
requirements.txt		requirements.txt
setup.py		setup.py
test_original.py		test_original.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ProtoDINO: Cross-Domain Few-Shot Object Detection via GroundingDINO and CLIP-Based Prototypes

模型权重

数据集

运行项目

实验结果

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ProtoDINO: Cross-Domain Few-Shot Object Detection via GroundingDINO and CLIP-Based Prototypes

模型权重

数据集

运行项目

实验结果

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages