本技术涉及计算机,尤其涉及一种图像处理方法及装置。
背景技术:
1、计算机文字识别,又可以称为光学字符识别(optical character recognition,ocr),指将图片上的文字提取出来,转换成文本形式,以便于用户使用。目前,ocr技术涉及到版面分析,也就是将图片上的文字分段落。但是,因为实际文档的多样性以及复杂性,所以在采用目前的cor技术进行版面分析时仍旧有不同段落的文字粘连的问题。
技术实现思路
1、本技术提供了一种图像处理方法及装置,可以使得图像中段落间的文字的粘连问题得到解决,进而可以提升版面分析的分段性能。
2、第一方面,提供一种图像处理方法,包括:确定第一连通域是否满足第一条件,第一条件包括以下至少一项:第一连通域的大小大于或等于第一阈值,第一连通域的外接矩形的最短边大于或等于第二阈值,第一连通域为第一图像中文本区域对应的连通域;在第一连通域满足第一条件时,对第一连通域依次进行第一腐蚀处理和第一膨胀处理,得到多个第二连通域。可以看出,第一图像中文本区域对应的第一连通域满足第一条件,这表明第一连通域存在文字粘连的问题,此时通过对第一连通域依次进行第一腐蚀处理和第一膨胀处理,可以得到多个第二连通域,也就是说,存在文字粘连的第一连通域被切分成多个独立的第二连通域了,这使得多个第二连通域之间文字的粘连问题得到解决,也可以理解为第一图像中段落间的文字的粘连问题得到解决,提升了版面分析的分段性能。
3、可选的,结合第一方面,对第一连通域依次进行第一腐蚀处理和第一膨胀处理,得到多个第二连通域,包括:采用第一卷积核的大小,对第一连通域依次进行第一腐蚀处理和第一膨胀处理,得到多个第二连通域,第一卷积核的大小根据第一连通域的外接矩形的最短边确定。可以看出,第一卷积核的大小根据第一连通域的外接矩形的最短边确定,也就是说,卷积核的大小与当前连通域的情况匹配,这使得在采用第一卷积核的大小,对第一连通域依次进行第一腐蚀处理和第一膨胀处理时,可以更好地切分出多个独立的第二连通域,进而可以使得多个第二连通域之间文字的粘连问题得到解决,提升了版面分析的分段性能。
4、可选的,结合第一方面,第一卷积核的大小为(m,n/m)或(n/m,m),m根据第一图像中文本区域的文字占用的像素大小确定,n为第一连通域的外接矩形的最短边。可以看出,第一卷积核的大小为(m,n/m)或(n/m,m),而m根据第一图像中文本区域的文字占用的像素大小确定,n为第一连通域的外接矩形的最短边,这使得在采用第一卷积核的大小,对第一连通域依次进行第一腐蚀处理和第一膨胀处理时,可以更好地切分出多个独立的第二连通域,进而可以使得多个第二连通域之间文字的粘连问题得到解决,提升了版面分析的分段性能。
5、可选的,结合第一方面,该方法还包括:确定多个第二连通域中是否存在满足第二条件的连通域,第二条件包括以下至少一项:第二连通域的大小大于或等于第一阈值,第二连通域的外接矩形的最短边大于或等于第二阈值;在多个第二连通域中存在满足第二条件的连通域时,则对多个第二连通域中满足第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理,得到多个第三连通域。可以看出,多个第二连通域中存在满足第二条件的连通域,这表明多个第二连通域中存在文字粘连的连通域,此时通过对多个第二连通域中满足第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理,可以得到多个第三连通域,也就是说,存在文字粘连的第二连通域被切分成多个独立的第三连通域了,这使得多个第三连通域之间文字的粘连问题得到解决,提升了版面分析的分段性能。
6、可选的,结合第一方面,对多个第二连通域中满足第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理,得到多个第三连通域,包括:采用第二卷积核的大小,对多个第二连通域中满足第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理,得到多个第三连通域,第二卷积核的大小根据多个第二连通域中满足第二条件的连通域的外接矩形的最短边确定。可以看出,第二卷积核的大小根据多个第二连通域中满足第二条件的连通域的外接矩形的最短边确定,也就是说,卷积核的大小与当前连通域的情况匹配,这使得在采用第二卷积核的大小,对多个第二连通域中满足第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理时,可以更好地切分出多个独立的第三连通域,进而可以使得多个第三连通域之间文字的粘连问题得到解决,提升了版面分析的分段性能。
7、可选的,结合第一方面,第二卷积核的大小为(k/m,m)或(m,k/m),k多个第二连通域中满足第二条件的连通域的外接矩形的最短边,m根据第一图像中文本区域的文字占用的像素大小确定。可以看出,第二卷积核的大小为(k/m,m)或(m,k/m),而k多个第二连通域中满足第二条件的连通域的外接矩形的最短边,m根据第一图像中文本区域的文字占用的像素大小确定,这使得在采用第二卷积核的大小,对多个第二连通域中满足第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理时,可以更好地切分出多个独立的第三连通域,进而可以使得多个第三连通域之间文字的粘连问题得到解决,提升了版面分析的分段性能。
8、可选的,结合第一方面,该方法还包括:确定多个第三连通域中是否存在满足第三条件的连通域,第三条件为第三连通域的大小大于或等于第三阈值;在多个第三连通域中存在满足第三条件的连通域时,获取多个第三连通域中满足第三条件的连通域的位置;根据多个第三连通域中满足第三条件的连通域的位置,确定多个第三连通域中满足第三条件的连通域是否超出第一图像的边界点;在多个第三连通域中满足第三条件的连通域超出第一图像的边界点时,针对多个第三连通域中满足第三条件的连通域,去除超出第一图像的边界点的区域。可以看出,多个第三连通域中存在满足第三条件的连通域,这表明多个第三连通域中存在无文字粘连问题的连通域了,此时通过多个第三连通域中满足第三条件的连通域的位置,可以根据多个第三连通域中满足第三条件的连通域的位置,确定多个第三连通域中满足第三条件的连通域是否超出第一图像的边界点,进而可以在多个第三连通域中满足第三条件的连通域超出第一图像的边界点时,针对多个第三连通域中满足第三条件的连通域,去除超出第一图像的边界点的区域,这可以提升版面分析的分段整齐度。
9、可选的,结合第一方面,该方法还包括:在多个第二连通域中不存在满足第二条件的连通域时,确定多个第二连通域中是否存在满足第四条件的连通域,第四条件为第二连通域的大小大于或等于第三阈值;在多个第二连通域中存在满足第四条件的连通域时,获取多个第二连通域中满足第四条件的连通域的位置;根据多个第二连通域中满足第四条件的连通域的位置,确定多个第二连通域中满足第四条件的连通域是否超出第一图像的边界点;在多个第二连通域中满足第四条件的连通域超出第一图像的边界点时,针对多个第二连通域中满足第四条件的连通域,去除超出第一图像的边界点的区域。可以看出,多个第二连通域中不存在满足第二条件的连通域,此时可以确定多个第二连通域中是否存在满足第四条件的连通域,当多个第二连通域中存在满足第四条件的连通域时,这表明这些第二连通域内无文字粘连问题。进一步的,可以根据多个第二连通域中满足第四条件的连通域的位置,确定多个第二连通域中满足第四条件的连通域是否超出第一图像的边界点,进而可以在多个第二连通域中满足第四条件的连通域超出第一图像的边界点时,针对多个第二连通域中满足第四条件的连通域,去除超出第一图像的边界点的区域,这可以提升版面分析的分段整齐度。
10、第二方面,提供一种图像处理装置,图像处理装置包括用于执行如第一方面中任一项所述方法的模块。
11、第三方面,提供一种图像处理装置,装置包括至少一个处理器和通信接口,至少一个处理器用于调用至少一个存储器中存储的计算机程序,以执行如第一方面中任一项所述的方法。
12、第四方面,提供一种通信系统,包括图像处理装置,图像处理装置用于实现如第一方面中任一项所述的方法。
13、第五方面,提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当计算机程序在一个或多个处理器上运行时,实现如第一方面中任一项所述的方法。
14、第六方面,提供一种计算机程序产品,计算机程序产品在一个或多个处理器上运行时,实现如第一方面中任一项所述的方法。
15、第七方面,提供一种芯片系统,包括至少一个处理器,存储器和接口电路,接口电路用于为至少一个处理器提供信息输入/输出,存储器中存储有计算机程序,当计算机程序在一个或多个处理器上运行时实现如第一方面中任一项所述的方法。
1.一种图像处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一连通域依次进行第一腐蚀处理和第一膨胀处理,得到多个第二连通域,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一卷积核的大小为(m,n/m)或(n/m,m),所述m根据所述第一图像中文本区域的文字占用的像素大小确定,所述n为所述第一连通域的外接矩形的最短边。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述多个第二连通域中满足所述第二条件的连通域依次进行第二腐蚀处理和第二膨胀处理,得到多个第三连通域,包括:
6.根据权利要求5所述的方法,其特征在于,所述第二卷积核的大小为(k/m,m)或(m,k/m),所述k所述多个第二连通域中满足所述第二条件的连通域的外接矩形的最短边,所述m根据所述第一图像中文本区域的文字占用的像素大小确定。
7.根据权利要求4所述的方法,其特征在于,所述方法还包括:
8.根据权利要求4所述的方法,其特征在于,所述方法还包括:
9.一种图像处理装置,其特征在于,所述图像处理装置包括用于执行如权利要求1-8中任一项所述方法的模块。
10.一种图像处理装置,其特征在于,所述装置包括至少一个处理器和通信接口,所述至少一个处理器用于调用至少一个存储器中存储的计算机程序,以执行如权利要求1-8中任一项所述的方法。
11.一种通信系统,其特征在于,包括图像处理装置,所述图像处理装置用于实现如权利要求1-8中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在一个或多个处理器上运行时,实现如权利要求1-8中任一项所述的方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品在一个或多个处理器上运行时,实现如权利要求1-8中任一项所述的方法。
14.一种芯片系统,其特征在于,包括至少一个处理器,存储器和接口电路,所述接口电路用于为所述至少一个处理器提供信息输入/输出,所述存储器中存储有计算机程序,当所述计算机程序在一个或多个处理器上运行时实现如权利要求1-8中任一项所述的方法。
