本发明涉及人工智能,特别涉及一种多轮对话方法、装置、设备及存储介质。
背景技术:
1、随着人工智能技术的不断发展,大模型在各个领域取得了显著的成果。在多轮对话系统中,大模型能够理解和生成自然语言,为用户提供更加智能化的服务。面对多轮对话任务时,通常需要使用检索技术来检索相关的信息,生成答案,然而,一方面由于对话中上下文信息的复杂性,在处理复杂对话场景时,现有的多轮对话技术往往会产生重构失误导致检索偏差;另一方面,传统的稀疏检索模型往往存在检索效果较差的问题,无法很好的查询到与问题紧密相关的文档,进而导致了回答出错。
2、综上,现有基于预训练大模型的多轮对话技术存在很多局限,主要体现在:当前的大模型虽然具备上下文对话能力,但在面对复杂程度较高的问题时容易产生混乱,导致检索效果出现偏差,并且由于多轮对话重构的准确度不高以及大模型与知识库结合的能力不足,容易造成输出答案与知识库不一致的问题,并且传统的稀疏检索模型往往存在检索效果较差的问题,无法很好的查询到与问题紧密相关的文档,进而导致了回答出错,以及多轮对话中的上下文信息无法充分应用,造成重要信息遗漏,进而导致输出答案错误的问题。因此,如何提高多轮对话系统中输出答案的准确度是本领域有待解决的问题。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种多轮对话方法、装置、设备及存储介质,通过语义分析更深入地理解用户的问题,并通过稀疏检索和向量检索进行多路检索后,通过语义融合生成答案,能够检索到更全面、多样的相关文档,提高了答案的丰富度和条理性。其具体方案如下:
2、第一方面,本申请提供了一种多轮对话方法,包括:
3、获取每个轮次的对话中用户输入的问题内容,并对所述问题内容进行语义分析生成对应的语义表示,以利用预训练大模型根据所述语义表示进行深度分析生成重构后问题;
4、分别利用稀疏检索和向量检索基于所述重构后问题在预设数据库中进行检索,以得到所述稀疏检索和所述向量检索分别对应的所述预设数据库中的文档和所述重构后问题的相关性,并基于所述相关性确定所述重构后问题对应的目标文档;
5、基于所述目标文档进行语义融合,以将所述目标文档进行拼接得到所述问题内容对应的对话答复。
6、可选的,所述获取每个轮次的对话中用户输入的问题内容,并对所述问题内容进行语义分析生成对应的语义表示,包括:
7、通过双向长短时记忆网络对所述问题内容进行处理,生成包含词的语义特征的词级语义表示;
8、基于自注意力机制对所述词级语义表示进行句级的语义表示,生成所述问题内容对应的句级语义表示。
9、可选的,所述利用预训练大模型根据所述语义表示进行深度分析生成重构后问题,包括:
10、利用所述预训练大模型根据所述句级语义表示进行深度分析,生成所述问题内容的详细语义结构,并基于预设语义结构转换算法将所述语义结构转换为所述重构后问题。
11、可选的,利用稀疏检索基于所述重构后问题在预设数据库中进行检索,包括:
12、对所述预设数据库中的所述文档进行分词,并构建所述文档的词袋模型;
13、通过bm25算法和所述词袋模型评估所述重构后问题与所述文档的关键词匹配程度,以根据所述关键词匹配程度确定所述文档与所述问题内容的第一相关性。
14、可选的,利用向量检索基于所述重构后问题在预设数据库中进行检索,包括:
15、利用所述预训练大模型确定所述预设数据库中的所述文档的文档语义表示,并将所述文档语义表示转化为高维语义空间中的语义向量;
16、通过余弦相似度确定所述重构后问题与所述语义向量的相似性,以根据所述相似性确定所述文档与所述问题内容的第二相关性。
17、可选的,所述基于所述相关性确定所述重构后问题对应的目标文档,包括:
18、基于所述第一相关性和所述第二相关性确定各文档的综合相关值,并基于所述综合相关值从大到小的顺序对所有文档进行排序;
19、筛选出位于排序结果的前若干数量的相似文档,并将所述相似文档作为所述重构后问题对应的所述目标文档。
20、可选的,所述基于所述目标文档进行语义融合,以将所述目标文档进行拼接得到所述问题内容对应的对话答复,包括:
21、对所述目标文档进行分句得到若干目标句子,并利用所述预训练大模型对每个所述目标句子进行语义表示;
22、利用句子级注意力机制对进行语义表示后的所述目标句子进行融合,并将融合后的目标句子输入所述预训练大模型生成所述问题内容对应的所述对话答复。
23、第二方面,本申请提供了一种多轮对话装置,包括:
24、问题重构模块,用于获取每个轮次的对话中用户输入的问题内容,并对所述问题内容进行语义分析生成对应的语义表示,以利用预训练大模型根据所述语义表示进行深度分析生成重构后问题;
25、多路检索模块,用于分别利用稀疏检索和向量检索基于所述重构后问题在预设数据库中进行检索,以得到所述稀疏检索和所述向量检索分别对应的所述预设数据库中的文档和所述重构后问题的相关性,并基于所述相关性确定所述重构后问题对应的目标文档;
26、文档拼接模块,用于基于所述目标文档进行语义融合,以将所述目标文档进行拼接得到所述问题内容对应的对话答复。
27、第三方面,本申请提供了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述的多轮对话方法。
28、第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的多轮对话方法。
29、本申请中首先获取每个轮次的对话中用户输入的问题内容,并对问题内容进行语义分析生成对应的语义表示,以利用预训练大模型根据语义表示进行深度分析生成重构后问题,然后分别利用稀疏检索和向量检索基于重构后问题在预设数据库中进行检索,以得到稀疏检索和向量检索分别对应的预设数据库中的文档和重构后问题的相关性,并基于相关性确定重构后问题对应的目标文档,之后基于目标文档进行语义融合,将目标文档进行拼接即可得到问题内容对应的对话答复。这样一来,通过采用语义分析方法,能够更深入地理解用户提出的问题,从而更全面、准确地把握用户意图,生成更为精准的答案,并且采用多路检索模块,不仅通过稀疏检索捕捉关键词的匹配,还通过向量检索考虑了文档的整体语义信息,利用多种检索方式,能够从数据库中检索到更全面、多样的相关文档,提高了答案的丰富度,之后通过语义融合方法,将检索到的相关文档进行有机拼接,生成更为流畅和连贯的最终答案,有助于提高用户的阅读体验,使答案更富有条理性和可读性。
1.一种多轮对话方法,其特征在于,包括:
2.根据权利要求1所述的多轮对话方法,其特征在于,所述获取每个轮次的对话中用户输入的问题内容,并对所述问题内容进行语义分析生成对应的语义表示,包括:
3.根据权利要求2所述的多轮对话方法,其特征在于,所述利用预训练大模型根据所述语义表示进行深度分析生成重构后问题,包括:
4.根据权利要求1所述的多轮对话方法,其特征在于,利用稀疏检索基于所述重构后问题在预设数据库中进行检索,包括:
5.根据权利要求4所述的多轮对话方法,其特征在于,利用向量检索基于所述重构后问题在预设数据库中进行检索,包括:
6.根据权利要求5所述的多轮对话方法,其特征在于,所述基于所述相关性确定所述重构后问题对应的目标文档,包括:
7.根据权利要求1至6任一项所述的多轮对话方法,其特征在于,所述基于所述目标文档进行语义融合,以将所述目标文档进行拼接得到所述问题内容对应的对话答复,包括:
8.一种多轮对话装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的多轮对话方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的多轮对话方法。