一种报告质检方法、装置及电子设备与流程

专利检索2026-06-07  2


本技术涉及人工智能和深度学习的,具体而言,涉及一种报告质检方法、装置及电子设备。


背景技术:

1、目前,针对报告进行质检的方式主要是人工审核的方式,例如:机构组织会安排专门的工作人员对报告进行质检审查以及修正等操作,此处的报告包括但不限于:超声报告、x光报告、心电图报告、病理学报告或年终总结报告等。在具体的实施过程中发现,由于检查报告通常是人来手工书写的,存在人为因素和主观判断,因此难免会出现一些错误,如错别字、标点符号错误、单位错误、用语不规范、常识错误等,且工作人员在质检过程中也会存在人为因素,从而导致报告的质检效率较低。


技术实现思路

1、本技术实施例的目的在于提供一种报告质检方法、装置及电子设备,用于改善报告的质检效率较低的问题。

2、本技术实施例提供了一种报告质检方法,包括:对待处理报告进行文本提取,获得报告文本;对报告文本进行分词,获得分词后的文本;使用预训练语言模型对分词后的文本进行质检,获得质检类别及该质检类别的起始位置和结束位置。在上述方案的实现过程中,通过对待处理报告中提取的报文文本进行分词,获得分词后的文本,并使用预训练语言模型对分词后的文本进行质检,有效地改善了工作人员在质检过程中存在的人为因素影响质检效率的情况,从而提高了报告的质检效率。

3、可选地,在本技术实施例中,在使用预训练语言模型对分词后的文本进行质检之前,还包括:获取多个样本报告和该样本报告的质检类别、起始位置和结束位置;以多个样本报告为训练数据,以该样本报告的质检类别、起始位置和结束位置为训练标签,对预训练语言模型进行训练。在上述方案的实现过程中,通过预训练语言模型结合上下文信息的语境来学习到如何根据前后文关系来分析潜在问题,能够更准确地识别报告文本中的各类错误(如拼写错误、语法错误、格式错误等),并精确地标记出错误发生的起始和结束位置,从而提高了报告中对于语境依赖性强的错误类型的检测准确率。

4、可选地,在本技术实施例中,使用预训练语言模型对分词后的文本进行质检,包括:使用预训练语言模型中的transformer结构层对分词后的文本进行特征提取,获得文本特征向量;使用预训练语言模型中的第一线性网络层对文本特征向量进行预测,获得起始位置和起始位置对应的类别概率;使用预训练语言模型中的第二线性网络层对文本特征向量进行预测,获得结束位置和结束位置对应的类别概率;根据起始位置对应的类别概率和结束位置对应的类别概率确定质检类别。在上述方案的实现过程中,通过在根据起始位置对应的类别概率和结束位置对应的类别概率确定质检类别的过程中,线性网络层会对文本特征向量中的每个单词向量或字符向量生成一个概率分布,对于有明显边界特征的错误类型检测(如拼写错误、语法错误中的词法层面错误),线性网络层能够准确捕捉到这些特征,从而提高了在开始位置和结束位置上的定位准确率。

5、可选地,在本技术实施例中,根据起始位置对应的类别概率和结束位置对应的类别概率确定质检类别,包括:从起始位置对应的类别概率和结束位置对应的类别概率中筛选出最大概率;从预先设置的多个质检类别中确定出最大概率对应的质检类别。在上述方案的实现过程中,通过从预先设置的多个质检类别中确定出最大概率对应的质检类别,有效地关注了最大概率的质检类别,使得模型可以更精确地识别和报告中的具体错误,而不是提供一系列可能的错误类别,从而提高了报告的质检效率。

6、可选地,在本技术实施例中,在获得质检类别及该质检类别的起始位置和结束位置之后,还包括:判断质检类别是否是预设错误类别;若是,则在待处理报告中起始位置与结束位置之间输出质检类别。在上述方案的实现过程中,通过精确地标记错误或问题的起始和结束位置,能够提供更准确的错误定位,这有助于快速识别和修正问题,减少对整体报告的不必要审查,从而提高了报告的质检效率。

7、可选地,在本技术实施例中,在判断质检类别是否为不存在错误的类别之后,还包括:若质检类别不是预设错误类别,则将待处理报告存储至数据库或者文件系统中,数据库或者文件系统中的报告用于打印或回溯查看。在上述方案的实现过程中,通过在质检类别不是预设错误类别的情况下,将待处理报告存储至数据库或者文件系统中,对于未被标记为错误的高质量报告,可以作为标准案例积累到数据库或文件系统中,这些数据库或文件系统中的报告用于可以后续训练和校准预训练语言模型,即使当前阶段报告没有发现错误,未来随着业务需求变化或者质检标准更新,这些存储的报告可以作为历史数据回溯分析,帮助评估之前的工作质量和改进空间,从而进一步提高预训练语言模型的准确率。

8、本技术实施例还提供了一种报告质检装置,包括:报告文本获得模块,用于对待处理报告进行文本提取,获得报告文本;分词文本获得模块,用于对报告文本进行分词,获得分词后的文本;分词文本质检模块,用于使用预训练语言模型对分词后的文本进行质检,获得质检类别及该质检类别的起始位置和结束位置。

9、可选地,在本技术实施例中,报告质检装置,还包括:报告数据获取模块,用于获取多个样本报告和该样本报告的质检类别、起始位置和结束位置;语言模型训练模块,用于以多个样本报告为训练数据,以该样本报告的质检类别、起始位置和结束位置为训练标签,对预训练语言模型进行训练。

10、可选地,在本技术实施例中,分词文本质检模块,包括:特征向量获得子模块,用于使用预训练语言模型中的transformer结构层对分词后的文本进行特征提取,获得文本特征向量;起始位置获得子模块,用于使用预训练语言模型中的第一线性网络层对文本特征向量进行预测,获得起始位置和起始位置对应的类别概率;结束位置获得子模块,用于使用预训练语言模型中的第二线性网络层对文本特征向量进行预测,获得结束位置和结束位置对应的类别概率;错误类别确定子模块,用于根据起始位置对应的类别概率和结束位置对应的类别概率确定质检类别。

11、可选地,在本技术实施例中,错误类别确定子模块,包括:最大概率筛选单元,用于从起始位置对应的类别概率和结束位置对应的类别概率中筛选出最大概率;质检错误确定单元,用于从预先设置的多个质检类别中确定出最大概率对应的质检类别。

12、可选地,在本技术实施例中,报告质检装置,还包括:质检类别判断模块,用于判断质检类别是否是预设错误类别;质检类别输出模块,用于若质检类别是预设错误类别,则在待处理报告中起始位置与结束位置之间输出质检类别。

13、可选地,在本技术实施例中,报告质检装置,还包括:报告存储打印模块,用于若质检类别不是预设错误类别,则将待处理报告存储至数据库或者文件系统中,数据库或者文件系统中的报告用于打印或回溯查看。

14、本技术实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器运行时执行上面描述的方法。

15、本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上面描述的方法。

16、本技术实施例还提供了一种计算机程序产品,包括:计算机程序或者计算机指令,计算机程序或者计算机指令被处理器运行时执行上面描述的方法。


技术特征:

1.一种报告质检方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述使用预训练语言模型对所述分词后的文本进行质检之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述起始位置对应的类别概率和所述结束位置对应的类别概率确定所述质检类别,包括:

4.根据权利要求1所述的方法,其特征在于,在所述获得质检类别及该质检类别的起始位置和结束位置之后,还包括:

5.根据权利要求4所述的方法,其特征在于,在所述判断所述质检类别是否为不存在错误的类别之后,还包括:

6.一种报告质检装置,其特征在于,包括:

7.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器运行时执行权利要求1至5任一所述的方法。

8.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行权利要求1至5任一所述的方法。

9.一种计算机程序产品,其特征在于,包括:计算机程序或者计算机指令,所述计算机程序或者所述计算机指令被处理器运行时执行权利要求1至5任一所述的方法。


技术总结
本申请提供一种报告质检方法、装置及电子设备,该方法包括:对待处理报告进行文本提取,获得报告文本;对报告文本进行分词,获得分词后的文本;使用预训练语言模型对分词后的文本进行质检,获得质检类别及该质检类别的起始位置和结束位置。在上述方案的实现过程中,通过对待处理报告中提取的报文文本进行分词,获得分词后的文本,并使用预训练语言模型对分词后的文本进行质检,有效地改善了工作人员在质检过程中存在的人为因素影响质检效率的情况,从而提高了报告的质检效率。

技术研发人员:石一磊,颜丙聪,胡敬良,牟立超,侯雨,陈咏虹
受保护的技术使用者:脉得智能科技(无锡)有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1163521.html

最新回复(0)