一种成对数据增强的模型训练方法及系统与流程

专利检索2024-12-15 39

本发明涉及人工智能技术深度学习模型训练的，特别是涉及一种成对数据增强的模型训练方法及系统。

背景技术：

1、深度学习模型训练过程会需要大量正样本的图片才能保证最终模型精度较好，而由于获取正样本成本往往较高，因而在有限正样本的条件下，更好的数据增强方法可以有效地提高模型精度。

2、现有的常见数据增强方法往往是基于像素级别的变换、基于图像拉伸扭曲的变换、有矩形框标注时基于矩形框整体的变换、基于多张图片合成拼接等；各类现有方案中，传统数据组增强imgaug项目是常见的像素级别的数据增强，包含图片锐化、扭曲、反转、模糊、颜色抖动等的一种或多种，每种数据增强还可以通过超参数调节图片变化的强弱程度。

3、一些目标检测方法中的数据增强会将矩形框内的目标在其他图片样本中粘贴，以提高正样本数量并且有更丰富的背景。但由于矩形框没能将目标边缘完全抠出来，会带着原背景的矩形框较为突兀地粘贴在新图片中。

4、因此，提供一种可以有效解决上述问题的成对数据增强的模型训练方法及系统是本领域技术人员亟待解决的问题。

技术实现思路

1、本发明的目的在于提供一种成对数据增强的模型训练方法，该方法逻辑清晰，安全、有效、可靠且操作简便，可有效减少模型对背景的误识别，在实际应用中误检会明显降低。

2、基于以上目的，本发明提供的技术方案如下：

3、一种成对数据增强的模型训练方法，包括如下步骤：

4、获取原始图像样本数据；

5、基于生成模型对所述原始图像样本数据进行数据增强，得到增强后的图像样本数据；

6、将所述增强后的图像样本数据按照成对输入至预设图像分类模型进行训练。

7、优选地，所述基于生成模型对所述原始图像样本数据进行数据增强，得到增强后的图像样本数据，包括如下步骤：

8、从所述原始图像样本数据中选取第i个负样本图像；

9、从所述第i个负样本图像中删除预设尺寸的矩形区域，得到第i个处理后的负样本图像；

10、获取对应的预设提示词；

11、将所述第i个处理后的负样本图像和所述预设提示词输入至多模态大模型中，以获取第i个正样本图像；

12、重复上述步骤，直至获取与所述原始图像样本数据相对应的增强后的图像样本数据。

13、优选地，所述将所述增强后的图像样本数据按照成对输入至预设图像分类模型进行训练，包括如下步骤：

14、定义所述图像分类模型训练过程中每次参数更新时使用预设批次值的图像样本数据；

15、将所述负样本图像与对应的所述正样本图像组成样本数据对；

16、在每个批次中，将随机采样数据和所述样本数据对均输入至所述图像分类模型进行训练；

17、其中，所述预设批次值的图像样本数据包括：所述随机采样数据和所述样本数据对。

18、优选地，

19、所述随机采样数据与所述样本数据对相等；

20、所述随机采样数据与所述样本数据对的和为所述预设批次值。

21、一种成对数据增强的模型训练系统，包括：

22、数据获取模块，用于获取原始图像样本数据；

23、数据增强模块，用于基于生成模型对所述原始图像样本数据进行数据增强，得到增强后的图像样本数据；

24、输入模块，用于将所述增强后的图像样本数据按照成对输入至预设图像分类模型进行训练。

25、本发明提供一种成对数据增强的模型训练方法，是通过获取原始图像样本数据后，基于生成模型对原始图像样本进行数据增强，得到增强后的图像样本数据；将增强后的图像样本数据按照成对输入至图像分类模型中进行训练。

26、相比于现有技术，本发明通过对已获取的原始图像样本数据进行数据增强，并在数据增强过程中改变了图片类别；在数据增强后改变了数据输入方式，可以有效的解决由于背景与目标在颜色形状等特征上相似而造成的误检问题，降低误检概率。

27、本发明还提供了一种成对数据增强的模型训练系统，由于与方法解决相同的技术问题，属于相同的技术构思，理应具有相同的有益效果，在此不再赘述。

技术特征：

1.一种成对数据增强的模型训练方法，其特征在于，包括如下步骤：

2.如权利要求1所述的成对数据增强的模型训练方法，，其特征在于，所述基于生成模型对所述原始图像样本数据进行数据增强，得到增强后的图像样本数据，包括如下步骤：

3.如权利要求2所述的成对数据增强的模型训练方法，，其特征在于，所述将所述增强后的图像样本数据按照成对输入至预设图像分类模型进行训练，包括如下步骤：

4.如权利要求3所述的成对数据增强的模型训练方法，其特征在于，

5.一种成对数据增强的模型训练系统，其特征在于，包括：

技术总结
本发明提供一种成对数据增强的模型训练方法及系统，方法是通过获取原始图像样本数据后，基于生成模型对原始图像样本进行数据增强，得到增强后的图像样本数据；将增强后的图像样本数据按照成对输入至图像分类模型中进行训练。相比于现有技术，本发明通过对已获取的原始图像样本数据进行数据增强，并在数据增强过程中改变了图片类别；在数据增强后改变了数据输入方式，可以有效的解决由于背景与目标在颜色形状等特征上相似而造成的误检问题，降低误检概率。该系统具有相同的有益效果。

技术研发人员：麻凯利,王晓龙
受保护的技术使用者：智慧眼科技股份有限公司
技术研发日：
技术公布日：2024/5/29

转载请注明原文地址:https://win.8miu.com/read-1147404.html

专利

最新回复(0)