表格问答方法、装置、存储介质及计算机设备与流程

专利检索2025-06-15  7


本发明涉及计算机及数字医疗领域,尤其是涉及一种表格问答方法、装置、存储介质及计算机设备。


背景技术:

1、在大数据时代,信息的数据量正在呈几何级数的增长,而其中很大一部分信息是以表格形式存在的,如电子表格、网页表格等。表格数据的结构化特性使得它们在诸多领域,尤其是医疗领域内有着极其广泛的应用,例如,在医院运营管理中利用表格数据管理病人信息、医生排班以及药品管理,还可以通过表格数据建立电子病例来存储和管理病人的诊疗信息等。然而对于从表格数据中提取并理解特定信息时,通常具备一定的挑战性。

2、随着人工智能技术的飞速发展,自然语言处理领域的研究也越来越深入,具体能够通过自然语言处理技术,对表格数据进行理解和解析,然后根据用户的自然语言问题,返回相应的答案,不仅能够减少人工查询和处理数据的时间和精力,提高效率和准确性。然而现有的表格问答方法仍然存在许多不足,例如对于问题的理解以及对于问题解析的过程精准度较低,最终输出的答案并不贴合自然语言,晦涩难懂,对使用者造成困扰。尤其在医疗系统中,对于答案获取的效率以及准确性尤为关键。


技术实现思路

1、有鉴于此,本申请提供了一种表格问答方法、装置、存储介质及计算机设备,主要目的在于解决现有技术中表格问答方法对于问题的理解以及解析的过程精准度低,输出的答案晦涩难懂的技术问题。

2、根据本发明的第一个方面,提供了一种表格问答方法,该方法包括:

3、获取用户输入的问题文本,对所述问题文本进行文本清洗处理,得到处理后的问题文本;

4、将所述处理后的问题文本输入至自然语言处理模型中,得到所述处理后的问题文本对应的结构化查询语句;

5、基于所述结构化查询语句,在预设数据库中获取所述结构化查询语句对应的查询结果;

6、对所述查询结果和所述问题文本进行整合,得到整合后的文本,并将所述整合后的文本输入至自然语言学习模型中,得到所述问题文本对应的自然语言答案。

7、根据本发明的第二个方面,提供了一种表格问答装置,该装置包括:

8、文本处理模块,用于获取用户输入的问题文本,对所述问题文本进行文本清洗处理,得到处理后的问题文本;

9、文本查询模块,用于将所述处理后的问题文本输入至自然语言处理模型中,得到所述处理后的问题文本对应的结构化查询语句;

10、查询结果获取模块,用于基于所述结构化查询语句,在预设数据库中获取所述结构化查询语句对应的查询结果;

11、答案输出模块,用于对所述查询结果和所述问题文本进行整合,得到整合后的文本,并将所述整合后的文本输入至自然语言学习模型中,得到所述问题文本对应的自然语言答案。

12、根据本发明的第三个方面,提供了一种存储介质,其上存储有计算机程序,程序被处理器执行时实现上述表格问答方法。

13、根据本发明的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述表格问答方法。

14、本发明提供的一种表格问答方法、装置、存储介质及计算机设备,首先获取用户输入的问题文本,对问题文本进行文本清洗处理,得到处理后的问题文本,然后将处理后的问题文本输入至自然语言处理模型中,得到处理后的问题文本对应的结构化查询语句,再基于结构化查询语句,在预设数据库中获取结构化查询语句对应的查询结果,最后对查询结果和问题文本进行整合,得到整合后的文本,并将整合后的文本输入至自然语言学习模型中,得到问题文本对应的自然语言答案。在上述方法中,通过对用户输入的问题文本进行文本清洗处理,便于更准确地理解用户的真实意图;利用自然语言处理模型将问题文本精准地转化为结构化查询语句,不仅提升了自然语言的处理效率,加强自然语言理解能力,并提高了问题文本的处理质量;利用结构化查询语句在预设数据库中获取对应的查询结果,能够快速准确高效地从数据库中检索信息,同时还可以降低查询错误率;最后将问题文本与查询结果整合后输入至自然语言学习模型中,能够得到问题文本对应的更偏向于人类语言的自然语言答案,提升了用户体验。上述方法能够更加精准的理解并掌握用户输入的问题文本,具有很强的自然语言理解能力,提升问题文本的处理质量以及处理效率,在医疗系统中带来更好的诊疗体验。

15、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。



技术特征:

1.一种表格问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述问题文本进行文本清洗处理,得到处理后的问题文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述自然语言处理模型的构建过程,包括:

4.根据权利要求3所述的方法,其特征在于,所述预设数据集包括spider数据集、sparc数据集和cosql数据集中的至少一个;所述在预设数据集中筛选目标数据集,并对所述目标数据集进行汉化处理,包括:

5.根据权利要求3所述的方法,其特征在于,所述待处理数据包括指令项、输入项和输出项;所述获取所述处理后的问题文本,将所述处理后的问题文本按照预设格式转化为待处理数据,包括:

6.根据权利要求1所述的方法,其特征在于,在所述利用所述训练集对所述初始自然语言处理模型进行训练之前,所述方法包括:

7.根据权利要求3所述的方法,其特征在于,所述利用所述测试集对所述目标自然语言处理模型进行优化测试,得到最终的自然语言处理模型,包括:

8.一种表格问答装置,其特征在于,所述装置包括:

9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。


技术总结
本发明涉及计算机技术领域及数字医疗领域,并公开了一种表格问答方法、装置、存储介质及计算机设备。其中方法包括首先获取用户输入的问题文本并进行文本清洗处理,得到处理后的问题文本,然后将处理后的问题文本输入至自然语言处理模型中,得到对应的结构化查询语句,再基于结构化查询语句,在预设数据库中获取结构化查询语句对应的查询结果,最后对查询结果和问题文本进行整合,并将整合后的文本输入至自然语言学习模型中,得到问题文本对应的自然语言答案。上述方法能够更加精准的理解并掌握用户输入的问题文本,具有很强的自然语言理解能力,提升问题文本的处理质量以及处理效率,在医疗系统中带来更好的诊疗体验。

技术研发人员:张恒源,常鹏,吉宗诚
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1155203.html

最新回复(0)