一种基于改进Deformable-DAB-DETR的小目标检测方法及系统

专利检索2025-03-27  10


本发明涉及计算机视觉,具体而言,涉及一种基于改进deformable-dab-detr的小目标检测方法及系统。


背景技术:

1、目标检测是计算机视觉中的基本任务之一,旨在定位和分类输入图像中感兴趣的目标物体。同时目标检测是行为理解、场景分类和视频内容检索等其他高级更高层次视觉任务的基础。小目标检测一直以来都是目标检测领域的一项难题,其旨在准确地检测出图像中那些具有非常少判别性特征的小目标(尺寸小于32像素×32像素),广泛应用于遥感图像分析、卫星图像分析等领域。相较于一般目标而言,小目标往往缺乏足够的外观信息,因此很难将其与背景或类似的目标区分开。在深度学习的推动下,目标检测算法取得了重大突破,但对于小目标的检测仍然是不尽人意的。在具有挑战性的目标检测数据集ms coco上,相对于大目标而言,小目标的检测性能通常只有其一半。小目标面临的挑战主要包括:可利用的判别性特征少、训练样本不均衡问题以及小目标聚集问题,这些问题阻碍了小目标检测性能的提升。

2、最近,carion等人提出了一种使用transformer进行目标检测的范式detectiontransformer(detr),它将目标检测看作一个集合预测问题,使用一组可学习的查询探寻图像中的潜在目标,并通过匈牙利匹配强制唯一的预测。detr极大简化了检测算法的设计流程,并有效移除了非极大值抑制和锚框生成步骤,实现了端到端的检测。detr利用multi-head self-attention来建模目标与其所处环境信息以及其他目标之间的关系,从而辅助目标的检测。然而,由于detr在计算注意力权重时伴随着高计算量和空间复杂度,因此难以处理高分辨率的特征,这导致了小目标的检测性能较差。deformable detr在detr的基础上引入了一种局部稀疏的高效注意力机制,即deformable attention。这一改进解决了detr难以处理高分辨率特征的问题,并显著提高了小目标的检测性能。

3、尽管deformable detr在小目标的检测性能方面取得了较大的突破,但由于deformable detr及小目标本身的特殊性,仍然存在两个问题。一方面,deformable detr中每个查询都负责一个相对较大的区域。然而,对于交叉区域存在的真实目标,不可避免地会导致多个查询之间的内部冲突,给模型带来了模糊的空间先验。特别是在处理小尺度目标时,这个问题会变得更加严重。另一方面,deformable detr采用匈牙利算法通过最小化全局匹配成本进行一对一标签分配,但在每次训练迭代中,只有少量的查询被分配为正样本,并没有对小目标施加特殊的关注。相应地,小目标的正样本数量也会减少,从而导致模型对小目标的学习减少,这无疑会损害小目标的检测性能。因此,有必要设计一种改进deformable detr的小目标检测方法,以提高小目标的检测精度。考虑到dab-detr中提出的基于锚框的动态位置查询和宽高调制的交叉注意力有助于提高检测性能,我们在deformable-dab-detr的基础上进一步进行改进。


技术实现思路

1、针对上述技术的不足,本发明的目的在于提供一种改进deformable-dab-detr的小目标检测方法及系统,用以解决现有技术中查询之间的内部冲突问题,以及监督稀疏性问题。该方法使用基本的deformable-dab-detr网络结构,采用了一种尺度感知的位置约束来使每个查询负责的区域更加集中,解决了查询之间的内部冲突问题,提供了更明确的空间先验。此外,设计了一种一对多的渐进性标签分配,为解码器提供逐层增加的监督信号,解决了监督稀疏性问题,有助于进行更适合小目标的标签分配。尺度感知的位置约束和渐进性标签分配仅在训练阶段中使用,只增加了可忽略不计的参数量和计算成本就能得到好的检测效果。

2、为了实现上述目的,本发明提供了一种采用尺度感知的位置约束和渐进性标签分配改进deformable-dab-detr的小目标检测方法,包括以下步骤:

3、s1、构建基本的deformable-dab-detr网络结构;

4、s2、利用尺度感知的位置约束动态调整每个查询的责任区域;

5、s3、采用渐进性标签分配来替代原有的匈牙利匹配,根据全局上下文信息动态分配正样本;

6、s4、使用ms coco训练集对改进后的deformable-dab-detr模型进行训练,并在验证集上进行验证。

7、本发明还提供了一种基于改进deformable-dab-detr的小目标检测系统,包括:(1)数据预处理模块,对输入图像进行预处理,便于后续统一训练和检测;(2)模型参数配置模块,根据实际使用的硬件设备,以及预期要达到的检测结果与推理fps,配置合适的模型参数,包括批次大小、优化器、学习率、训练轮数、调整学习率的训练轮数、特征提取网络等;(3)模型训练模块,通过最小化在真实目标集合和预测集合之间的全局匹配成本来进行一对多的渐进性标签分配,从而最小化总损失,包括分类损失、回归损失和新增的尺度感知的位置约束损失;(4)目标检测模块,对于待检测的图像,利用训练好的模型及相应的权重文件进行检测得到目标检测结果,比较检测结果与推理fps是否达到预期。

8、本发明与现有技术相比,具备以下有益效果:(1)本发明采用了尺度感知的位置约束,根据目标的尺度进行自适应的位置约束,使得每个查询负责的区域更加集中。特别地,对小尺度的目标做特殊处理,针对小目标聚集需要大量查询负责相近区域的情况,施加相较于其他尺度目标较小的约束,实现了更好的查询优化。(2)本发明针对监督稀疏性问题,设计了一种一对多的渐进性标签分配,从全局角度考虑上下文信息进行适应各种目标(不同尺度、宽高比和遮挡等情况)的标签分配,为模型训练迭代提供丰富的监督信号。相较于原有的匈牙利匹配,增加了小目标的正样本数量。(3)本发明提出的尺度感知的位置约束和渐进性标签分配在推理阶段可以舍弃,同时只引入了可忽略不计的参数量和计算成本。此外,本发明提出的方法可以很容易集成到其他现有的detr变体中,进一步提高小目标的检测性能。



技术特征:

1.一种基于改进deformable-dab-detr的小目标检测方法,其特征在于,所述方法由计算机执行,包括以下步骤:

2.如权利要求1所述的一种基于改进deformable-dab-detr的小目标检测方法,其特征在于步骤s1中,所述网络结构包括:特征提取网络backbone、transformer编码器和解码器、查询选择组件、特定任务的预测头;给定一幅输入图像,deformable-dab-detr首先使用backbone抽取多尺度图像特征,再经过一系列变换;其次,变换后的多尺度特征和相应的位置编码一起经过transformer编码器得到编码器特征;使用查询选择组件提取前k个分类得分较高的编码器特征,利用编码器特征和其所在位置初始化位置查询和内容查询;然后,将编码器特征和查询(包括位置查询和内容查询两部分)送入transformer解码器,探寻图像中潜在的目标物体,并对解码器输出进行微调;最后,对于每个transformer解码器层的输出,使用特定任务的预测头得到预测集合。

3.如权利要求1所述的一种基于改进deformable-dab-detr的小目标检测方法,其特征在于,步骤s2的具体实现过程如下:

4.如权利要求1所述的一种基于改进deformable-dab-detr的小目标检测方法,其特征在于,步骤s3的具体实现过程如下:

5.如权利要求1所述的一种基于改进deformable-dab-detr的小目标检测方法,其特征在于,步骤s4的具体实现过程如下:

6.一种基于改进deformable-dab-detr的小目标检测系统,其特征在于,包含以下几个模块:


技术总结
本发明公开了一种基于改进Deformable‑DAB‑DETR的小目标检测方法及系统,通过在训练阶段引入尺度感知的位置约束和渐进性标签分配来解决查询之间的内部冲突问题以及监督稀疏性问题。具体而言,我们采用了一种尺度感知的位置约束,根据目标的尺度进行自适应的位置约束,使得每个查询负责的区域更加集中。然后,我们设计了一种一对多的渐进性标签分配,为解码器提供逐层增加的监督信号,有助于进行更适合小目标的标签分配。本发明提出的方法可以很容易集成到其他现有的DETR变体中,同时只引入了可忽略不计的参数量和计算成本,进一步提高小目标的检测性能。

技术研发人员:张创,桂彦
受保护的技术使用者:长沙理工大学
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1151530.html

最新回复(0)