本发明涉及图像处理,特别是指一种用于人工智能学习的图像数据处理方法及系统。
背景技术:
1、图像数据的质量和数量对人工智能模型训练的效果有直接影响,为了提高模型对不同视觉特征的识别能力,需要提供包含充足样例的图像训练数据集。
2、但是单纯依靠收集大量数据的方法成本过高且效率低下,且图像拥有大量的有效数据,整个图像不易使用。
3、有鉴于此,特提出本发明。
技术实现思路
1、本发明要解决的技术问题是提供一种用于人工智能学习的图像数据处理方法及系统,在病理切片上预提取高风险的恶性细胞区域,协助医生进行诊断,作出决策,通过此流程,在大幅减少病理医生的工作量的同时,也降低了误诊率,提高了病理医生的工作效率,从而使病理医生可以将精力集中到更加复杂的病例上。
2、为解决上述技术问题,本发明的技术方案如下:
3、第一方面,一种用于人工智能学习的图像数据处理方法,所述方法包括:
4、将原始图像集内元素根据神经网络输入要求调整为预设整数倍的大小,得到至少一个图像切块;
5、根据所述灰度差值判定所述图像切块是否无效,并排除判定为无效的图像切块;
6、于有效的图像切块中切割出24~84%重叠面积的切块,得到预切片;
7、对预切片进行处理生成增强后的切片,并将增强的切片进行汇总,得到对应所述原始图像集的图像数据集。
8、进一步的,将原始图像集内元素根据神经网络输入要求调整为预设整数倍的大小,得到至少一个图像切块,包括:
9、检查原始图像集内元素的大小尺寸;
10、计算将原始图像缩放至满足神经网络输入要求的目标尺寸;
11、保持原始图像集内元素的长宽比不变,通过缩放处理将原始图像集内元素的尺寸调整为目标尺寸;
12、使用零填充将缩放处理的原始图像集内元素扩充为整数倍大小,以完全满足神经网络的输入要求;
13、将原始图像集内元素等分切块,得到图像切块,其中,切块大小神经网络输入层节点数目相匹配。
14、进一步的,根据所述灰度差值判定所述图像切块是否无效,并排除判定为无效的图像切块,包括:
15、计算每个图像切块内相邻像素之间的灰度值差;
16、判断差值是否低于预设的无效切块判定阈值;
17、如果差值低于预设的无效切块判定阈值,则判定该图像切块为无效;
18、将判定为无效的图像切块全部排除,得到有效的图像切块。
19、进一步的,于有效的图像切块中切割出24~84%重叠面积的切块,得到预切片,包括:
20、设置切割参数,确定预切片与原切块的期望重叠面积为24~84%;
21、对每个切块上根据所述期望重叠面积要求进行切割,得到初始预切片;
22、计算每个初始预切片与对应原切块的重叠面积,核对是否满足所述期望重叠面积;
23、保留满足所述期望重叠面积的预切片,得到预切片。
24、进一步的,对预切片进行处理生成增强后的切片,并将增强的切片进行汇总,得到对应所述原始图像集的图像数据集,包括:
25、记录每个预切片在原始图像中的位置信息;
26、根据每个预切片在原始图像中的位置信息确定是否对预切片进行翻转操作;
27、对进行翻转操作的预切片,计算翻转后切片的中心位置并进行反转操作;
28、根据每个预切片在原始图像中的位置信息对预切片进行旋转操作;
29、根据每个预切片在原始图像中的位置信息对预切片进行平移和缩放变换,得到初始目标切片;
30、在初始目标切片中截取出目标切片,并对目标切片进行调整,以生成增强后的切片;
31、将所有增强后的切片汇总,生成对应原始图像集的图像数据集。
32、进一步的,根据每个预切片在原始图像中的位置信息对预切片进行旋转操作,包括:
33、设置第一确定阈值区间,若预切片中心点属于第一确定阈值区间,则旋转 n×90度,其中,n为正整数;
34、若预切片中心点不属于第一确定阈值区间,则旋转b度,其中,360/b=n。
35、进一步的,在初始目标切片中截取出目标切片,并对目标切片进行调整,以生成增强后的切片,包括:
36、对截取出的目标切片进行颜色空间的增强;
37、对目标切片使用不同类型滤波器进行滤波处理;
38、对目标切片添加不同类型的噪声;
39、对目标切片通过图像质量增强算法进行增强,得到增强后的切片。
40、第二方面,一种用于人工智能学习的图像数据处理系统,包括:
41、调整模块,用于将原始图像集内元素根据神经网络输入要求调整为预设整数倍的大小,得到至少一个图像切块;
42、判定模块,用于根据所述灰度差值判定所述图像切块是否无效,并排除判定为无效的图像切块;
43、切割模块,用于于有效的图像切块中切割出24~84%重叠面积的切块,得到预切片;
44、生成模块,用于对预切片进行处理生成增强后的切片,并将增强的切片进行汇总,得到对应所述原始图像集的图像数据集。
45、第三方面,一种计算设备,包括:
46、一个或多个处理器;
47、存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述方法。
48、第四方面,一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,该程序被处理器执行时实现上述方法。
49、本发明的上述方案至少包括以下有益效果:
50、本发明的上述方案,扩充了数据集数量,增加了模型训练时的样本量,提高模型的鲁棒性;增加了数据多样性,可以使数据集包含更丰富的视觉特征,提高了模型的泛化能力;提高了模型对图像位置、尺寸、角度变化的适应能力,减少了对这些因素的依赖;改善了模型对图像颜色、亮度变化的适应能力,提高了对图像质量变化的鲁棒性;通过添加噪声点,增加了模型对复杂场景的适应能力,提高了模型在复杂环境中的应用效果;采用已有数据进行增强,降低了获取更多数据的成本,提高了数据利用效率。
1.一种用于人工智能学习的图像数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于人工智能学习的图像数据处理方法,其特征在于,将原始图像集内元素根据神经网络输入要求调整为预设整数倍的大小,得到至少一个图像切块,包括:
3.根据权利要求2所述的用于人工智能学习的图像数据处理方法,其特征在于,根据所述灰度差值判定所述图像切块是否无效,并排除判定为无效的图像切块,包括:
4.根据权利要求3所述的用于人工智能学习的图像数据处理方法,其特征在于,于有效的图像切块中切割出24~84%重叠面积的切块,得到预切片,包括:
5.根据权利要求4所述的用于人工智能学习的图像数据处理方法,其特征在于,对预切片进行处理生成增强后的切片,并将增强的切片进行汇总,得到对应所述原始图像集的图像数据集,包括:
6.根据权利要求5所述的用于人工智能学习的图像数据处理方法,其特征在于,根据每个预切片在原始图像中的位置信息对预切片进行旋转操作,包括:
7.根据权利要求6所述的用于人工智能学习的图像数据处理方法,其特征在于,在初始目标切片中截取出目标切片,并对目标切片进行调整,以生成增强后的切片,包括:
8.一种用于人工智能学习的图像数据处理系统,其特征在于,包括:
9.一种计算设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。