一种基于AMFFNet和IACGAN双网络的跨任务迁移SAR目标识别方法

专利检索2026-05-14  10


本发明涉及雷达自动目标识别,具体说是一种基于设计的注意力多尺度特征融合网络(amffnet)和改进的辅助分类生成对抗网络(iacgan)的跨任务迁移sar目标识别方法。


背景技术:

1、合成孔径雷达(synthetic aperture radar,sar)自动目标识别(automatictarget tecognition,atr)技术在军事和国土安全应用中具有重要价值,如敌我辨识、战场监视和灾害救援等。与可见光和红外线等遥感技术相比,sar能够在各种地理地形中提供全天候成像,是提取目标信息的主要方法之一。

2、卷积神经网络(convolutional neural networks,cnn)在sar目标识别中的应用引发了对基于cnn的sar目标识别方法的广泛研究,并取得了良好的识别效果。然而,cnn的识别性能在很大程度上取决于训练样本,如果训练样本稀缺,模型就容易出现过拟合。为了缓解样本不足时的过拟合问题,现有方法中提出了一种识别模型,利用cnn进行特征提取,利用svm进行分类,该模型在移动和静止目标获取与识别数据集上取得了良好的效果。有的文献将形态成分分析(morphological component analysis,mca)用作cnn输入层的预处理步骤,以提高识别准确率。

3、数据增强被证明是解决sar图像中标记样本有限问题的有效方法。如有的文献应用了平移、添加噪声和姿态合成等方法对数据进行增强;有的文献通过裁剪、翻转和按比例批量处理来进行数据增强,从而使模型更快更好地收敛;文献han j, fang p, et al. youonly cut once: boosting data augmentation with a single cut[c]//internationalconference on machine learning. pmlr, 2022: 8196-8212提出了一种你只需切一次(you only cut once,yoco)的数据增强方法。yoco通过将图像切一刀分为两部分,并对每一部分应用单独的数据增强操作来实现图像增强。然后将图像的两个部分合并在一起,实现整张图像的增强。yoco具有很强的可扩展性,其他数据增强方法可以与之相结合。因此,yoco可用于增强每个样本的多样性,并鼓励神经网络从部分信息中识别物体。

4、迁移学习也是解决缺乏标注样本问题的有效方法,并且已被广泛的研究。大型场景图像被用来训练卷积自动编码器(auto-encoder,ae),然后用于sar目标识别。或者使用了在 imagnet 数据集上训练的vgg模型,并将其应用于 sar atr,然后利用 sar 数据对模型进行微调,以达到优化目的。或者采用对抗编码网络提取图像特征,并将编码后的特征输入分类器进行分类,在mstar数据集上取得了良好的识别精度。然而,虽然无监督生成网络可以提取合成孔径雷达图像的数据分布特征,但学习到的与分类相关的特征表示却相对有限。

5、但是,目前并没有有效的方法在少量训练样本的情况下仍然能够获得较好的识别性能,因此亟需设计具有强扩展性的数据增强方法,并且有效消除数据噪声的sar图像处理方法,以提高图像在小样本下的总识别率。


技术实现思路

1、为解决上述问题,本发明的目的是提供一种基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法。

2、本发明为实现上述目的,通过以下技术方案实现:

3、一种基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,包括以下步骤:

4、①使用yoct方法构建数据集,对训练样本进行数据增强,以扩充样本并增加样本多样性;

5、所述yoct方法构建数据集,首先将单幅图像切两刀分成四幅子图像,然后对四幅子图像进行不同程度的增强,最后合并成一幅更具多样化的增强图像;

6、②使用训练样本对改进的辅助分类生成对抗网络iacgan进行监督训练,并获得iacgan鉴别器的权重参数;

7、③使用iacgan鉴别器的权重参数来初始化设计的注意力多尺度特征融合网络amffnet的部分参数,并使用训练样本对amffnet进行微调;

8、④使用微调后的amffnet进行sar目标识别。

9、优选的,步骤①使用yoct方法构建数据集为基于随机翻转和颜色抖动的yoct方法,包含垂直切割和水平切割两个步骤,具体的:

10、首先,将sar图像垂直切割成左右两个大小相等的图像部分,为了保持目标在中心位置,对左右两个图像部分分别进行随机垂直翻转,并为每个子图像应用不同程度的颜色抖动,处理后,两个子图像合并成一张完整的图像;

11、然后,先前合并的图像再一次在水平方向上被切割成上下两个大小相等的子图像,类似地,为了保持目标在中心位置,对上下两个子图像分别进行随机水平翻转,并为每个子图像应用不同程度的颜色抖动;

12、最后,两个子图像再次合并成一张完整的图像,完成数据增强过程。

13、优选的,步骤①使用yoct方法构建数据集为基于mixup的yoct方法,具体的:

14、首先将sar图像均匀地切分成四个大小相等的子图像,然后,从训练批次中随机选择一张sar图像,并将四个切割的子图像分别与随机选择的sar图像通过mixup进行混合,所提出方法得到的混合样本的计算公式如下:

15、,

16、,

17、其中,,是四个切割的子图像,是随机选择的sar图像,是插值参数,用于控制插值过程中和的权重,是一个随机数;是指得到的四个进行平均后的平均数;生成的新样本及其标签表示为:

18、,

19、其中,是用于在高度和宽度维度上进行图像拼接的操作,分别是的标签,四个子图像和随机选择的 sar 图像通过mixup进行混合,得到,最终的损失值由以下公式给出:

20、,

21、其中,是交叉熵损失函数,是网络的最终输出。

22、优选的,步骤②包括以下步骤:

23、将潜在向量和标签的组合输入生成器,输出带有输入类别标签的伪sar图像,在训练生成器时,鉴别器保持其网络参数固定,

24、目标函数由两部分组成:真假鉴别损失和分类损失;

25、表示为:,

26、其中,表示给定输入图像时鉴别器的概率分布,是指给定的真实图像,是指生成器生成的图像。是指期望值, real是指真实图片数据, fake是指生成图片数据;

27、表示为:,

28、其中,表示给定图像时鉴别器对图像的类别标签的概率分布,c为输入图像的类别,生成器的损失表示为:,

29、生成器的训练目标是最大化,即使生成的数据更加逼真,并同时最大化其被正确分类的概率;

30、(2b)鉴别器的输入为生成器的输出或训练样本,鉴别器的输出是输入图像的真实性和类别,在训练鉴别器时,生成器保持其网络参数固定;

31、鉴别器的损失表示为:,

32、鉴别器的训练目标是最大化,即尽可能增强鉴别器对真实数据和伪造数据的分类和区分能力;

33、(2c)通过交替训练来优化生成器和鉴别器,为了保持对抗平衡,生成器和鉴别器以四比一的比例进行更新,使用反向传播算法来优化它们各自的损失函数;

34、(2d)上述过程重复进行,直到达到纳什均衡,保存并获得iacgan鉴别器的权重参数。

35、优选的,步骤③包括以下步骤:

36、(3a)将预训练的iacgan鉴别器的部分权重参数迁移到amffnet中,然后使用增强的训练样本来训练整个网络;

37、(3b)amffnet的网络参数均不进行冻结,在每次迭代中,使用损失函数通过反向传播算法更新网络的所有参数,在这个过程最小化损失值并优化网络,使用交叉熵损失函数来比较每个类别的预测概率与相应的真实标签,计算公式如下:

38、,

39、其中,表示第个样本的真实标签,表示预测的第个样本属于不同类别的概率,表示样本数量,表示模型在给定输入后对每个可能类别的预测概率分布。

40、优选的,步骤③所述使用训练样本对amffnet进行微调中amffnet的网络模块为多尺度深度可分离卷积模块,具体的:

41、首先,在深度卷积部分,通过使用大小为3x3、5x5和7x7的卷积核,提出的多尺度深度可分离卷积mdsc模块;其次,在点卷积部分,使用两个1x1卷积来组合融合后的特征,其中第一个1x1卷积将通道数翻倍,第二个1x1卷积将通道数压缩回输入大小以获得最终的特征;最后,该模块通过残差的方式进行连接;

42、mdsc模块表示为:

43、,

44、其中,表示输入特征;是卷积核大小为的点卷积,是特征拼接操作,是卷积核大小为3的深度卷积,其余参数类推。

45、优选的,步骤③所述使用训练样本对amffnet进行微调中amffnet的模块为多分支融合模块,具体的:

46、在每个多分支融合mbf模块之前,输入首先进行下采样,下采样率由步长控制,经过下采样后,它通过两个视觉注意力多尺度增强vame模块,在vame中,输入首先通过视觉注意力va模块,然后通过批归一化和gelu激活函数后输入到mdsc模块;输出是在输入经过droppath后,通过与原始输入建立残差连接而得到的,第一个vame模块的输出有一个分支,经过视觉注意力模块和droppath处理后,与第一个vame模块的输出建立残差连接,两个分支的输出特征被连接在一起,得到更丰富的融合特征,最后,通过1×1卷积将融合特征压缩,得到mbf模块的最终输出;

47、mbf模块表示为:

48、,

49、其中,droppath是指在训练期间以概率p将整条路径置为0,mdsc表示多尺度深度可分离卷积模块,va是视觉注意力模块,vame是视觉注意力多尺度增强,gelu是激活函数,bn是批归一化,conv1x1表示卷积核大小为1的卷积。

50、优选的,步骤④使用微调后的amffnet进行sar目标识别的具体步骤为:

51、首先,采用mstar数据集中15°视角下的数据来作为测试集,测试微调后的amffnet的sar目标识别性能,其中共2425张sar的图像;其次将测试集输入微调好的amffnet网络中,得到的输出为每张测试图像的识别结果;最后将得到的所有测试结果进行汇总,即可得到该方法在该测试场景下的总识别率。

52、本发明相比现有技术具有以下优点:

53、本发明提出了一种改进的数据增强方法 称为你只需切两次(you only cuttwice,yoct),并将其应用于sar目标识别领域。该方法具有很强的扩展性,能有效提高每个样本的增强多样性;本发明提出了一种 多尺度深度可分离卷积(multi-scale depthwiseseparable convolution,mdsc)模块,并将其应用于所设计的amffnet。该模块可提取多尺度特征,并通过使用深度可分离卷积结构,以较少的参数和较高的效率提取丰富的目标特征;基于视觉注意力(visual attention,va)、双重注意力(dual attention,da)和mdsc模块,本发明设计并构建了用于sar目标识别的amffnet,该网络具有良好的特征表达和判别能力,使其在图像分类任务中取得了较好的效果;本发明将iacgan作为预训练任务,该网络可以在有监督的条件下提取丰富的特征,这些提取的特征可以改进识别任务,从而帮助amffnet获得更好的识别性能;在mstar数据集上的实验验证了本发明在sar目标识别中的有效性。

54、本发明是基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,在只有少量训练样本的情况下仍然能够获得较好的识别性能;本发明设计的数据增强方法具有很强的扩展性,并且能够有效的增强样本和提高样本的多样性;本发明所提出的网络使用了注意力机制,因此该网络对存在噪声的sar图像也具有很好的鲁棒性。


技术特征:

1.一种基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤①使用yoct方法构建数据集为基于随机翻转和颜色抖动的yoct方法,包含垂直切割和水平切割两个步骤,具体的:

3.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤①使用yoct方法构建数据集为基于mixup的yoct方法,具体的:

4.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤②包括以下步骤:

5.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤③包括以下步骤:

6.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤③所述使用训练样本对amffnet进行微调中amffnet的模块为多尺度深度可分离卷积模块,具体的:

7.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤③所述使用训练样本对amffnet进行微调中amffnet的模块为多分支融合模块,具体的:

8.根据权利要求1所述的基于amffnet和iacgan双网络的跨任务迁移sar目标识别方法,其特征在于:步骤④使用微调后的amffnet进行sar目标识别的具体步骤为:


技术总结
本发明公开了一种基于AMFFNet和IACGAN双网络的跨任务迁移SAR目标识别方法,涉及雷达自动目标识别技术领域;本发明提出了YOCT数据增强方法,根据SAR ATR的应用场景进行了改进。首先使用所提出的YOCT方法来增强训练样本;然后通过监督学习的方式对IACAGN进行训练,之后将IACGAN的鉴别器的部分参数转移到AMFFNet;最后,通过训练样本对AMFFNet进行微调,使AMFFNet具有更强的特征提取和分类能力,达到更好的识别效果,本发明在只有少量训练样本的情况下仍然能够获得较好的识别性能,本发明所提出的网络使用了注意力机制,因此该网络对存在噪声的SAR图像也具有很好的鲁棒性。

技术研发人员:杜晓林,万训杨,刘珅砚,唐梦皎,李洪高
受保护的技术使用者:烟台大学
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1163182.html

最新回复(0)