本申请涉及图像识别,特别是涉及一种图像识别方法、图像识别装置及计算机存储介质。
背景技术:
1、细粒度目标识别任务在现实生活中有着广泛的应用需求,例如生态保护中鸟类、鱼类、花草类的细粒度识别,农业场景下植物叶片生长情况的细粒度识别,交通场景下车型车系的细粒度识别,社区管理中不同种类狗的细粒度识别,以及无人售货场景下对商品的细粒度识别等。因此,对细粒度目标识别的研究有着较高的应用价值。
2、目前,细粒度目标识别的主要方法有:(1)基于强监督的定位-识别方法,标签信息往往会包括类别、区域定位框、部件、关键点等信息,准确度相对较好,但需要较高的标注成本,准确度和效率较差。(2)基于弱监督的定位-识别方法,一种方法是使用r-cnn先定位关注区域,再进行精细化分类,这类方法准确度较高,但会产生大量无关区域,影响算法的效率;另一种方法是通过注意力机制/聚类等方法构建定位子网络,实现判别性区域的发现,该类方法的准确度不高。
技术实现思路
1、为解决上述技术问题,本申请提出了一种图像识别方法、装置及计算机存储介质。
2、为解决上述技术问题,本申请提出了一种图像识别方法,包括:将待识别图像输入第一路孪生网络,提取目标共性特征;将待识别图像输入第二路孪生网络,提取目标特异性特征;将所述目标共性特征和所述目标特异性特征输入特征融合单元,获取融合深层特征;将融合深层特征输入识别网络,推理得到目标识别结果。
3、其中,所述图像识别方法,还包括:计算各训练样本对标签的匹配度权重;确定第一路孪生网络的第一损失函数和确定第二路孪生网络的第二损失函数;将训练样本对输入孪生网络,利用所述第一路孪生网络提取训练图像对的第一目标特征距离,利用第二路孪生网络提取训练图像对的第二目标特征距离;按照所述第一目标特征距离小于共性阈值的方向,使用bp算法对所述第一路孪生网络进行训练;按照所述第二目标特征距离大于特异性阈值的方向,使用bp算法对所述第二路孪生网络进行训练。
4、其中,所述图像识别方法还包括:将训练样本对中的每个训练图像的共性特征和特异性特征输入特征融合单元,获取其融合深层特征;将所述融合深层特征输入识别网络,获取目标预测标签;按照所述目标预测标签与目标真实标签计算所得的损失值最小化方向,使用bp算法对所述识别网络进行训练。
5、其中,所述计算各训练样本对标签的匹配度权重,包括:响应于所述训练样本为相同标签的图像数据,利用数值1与标签平滑参数的差值,乘上第一权重扩大参数,得到所述匹配度权重;响应于所述训练样本为不同标签的图像数据,利用标签平滑参数乘上第二权重扩大参数,得到所述匹配度权重;其中,所述标签平滑参数为小于0.3的正数。
6、其中,所述确定第一路孪生网络的第一损失函数,包括:获取所述第一路孪生网络的共性阈值;获取所述训练样本的共性特征距离与所述共性阈值的第一差值;在所述第一差值大于0时,利用所述第一差值以及所述匹配度权重,确定所述第一损失函数;在所述第一差值小于0时,利用0以及所述匹配度权重,确定所述第一损失函数。
7、其中,所述确定第二路孪生网络的第二损失函数,包括:获取所述第二路孪生网络的特异性阈值;获取所述特异性阈值与所述训练样本的特异性特征距离的第二差值;在所述第二差值大于0时,利用所述第二差值以及所述匹配度权重,确定所述第二损失函数;在所述第二差值小于0时,利用0以及所述匹配度权重,确定所述第二损失函数。
8、其中,孪生网络模型结构采用前馈神经网络模型或模型组合;第一路孪生网络模型结构和第二路孪生网络模型结构相同,或不同;每路孪生网络的两个子网络结构相同,且共享权重。
9、其中,所述特征融合单元,指的是线性或非线性的特征融合模块。
10、为解决上述技术问题,本申请提出一种图像识别装置,所述图像识别装置包括存储器以及与所述存储器耦接的处理器;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的图像识别方法。
11、为解决上述技术问题,本申请提出一种计算机存储介质,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现如上述的图像识别方法。
12、与现有技术相比,本申请的有益效果是:本申请提出一种图像识别方法、装置以及计算机存储介质,图像识别装置将待识别图像输入第一路孪生网络,提取目标共性特征;将待识别图像输入第二路孪生网络,提取目标特异性特征将所述目标共性特征和所述目标特异性特征输入特征融合单元,获取融合深层特征;将融合深层特征输入识别网络,推理得到目标识别结果。通过上述方式,能够学习样本对之间的共性特征和特异性特征,可以极大提升目标高维特征的挖掘深度,进而提高细粒度目标识别的准确率。
1.一种图像识别方法,其特征在于,所述图像识别方法包括:
2.根据权利要求1所述的图像识别方法,其特征在于,所述图像识别方法,还包括:
3.根据权利要求2所述的图像识别方法,其特征在于,所述图像识别方法还包括:
4.根据权利要求2所述的图像识别方法,其特征在于,所述计算各训练样本对标签的匹配度权重,包括:
5.根据权利要求2所述的图像识别方法,其特征在于,所述确定第一路孪生网络的第一损失函数,包括:
6.根据权利要求2或5所述的图像识别方法,其特征在于,所述确定第二路孪生网络的第二损失函数,包括:
7.根据权利要求1所述的图像识别方法,其特征在于,
8.根据权利要求1所述的图像识别方法,其特征在于,
9.一种图像识别装置,其特征在于,所述图像识别装置包括存储器以及与所述存储器耦接的处理器;
10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现如权利要求1至8任一项所述的图像识别方法。
