本发明涉及数据处理,尤其涉及一种问答方法、装置、电子设备及存储介质。
背景技术:
1、近年来,随着深度学习技术的不断发展,越来越多的研究人员开始探索将深度学习技术应用于文本检索领域。其中,最具代表性的技术之一就是bert(bidirectionalencoder representations from transformers)模型。bert模型通过预训练的方式,在大量无标注文本数据上学习到了丰富的语言特征,然后在此基础上进行微调,用于具体的文本检索任务。这种方法虽然能够在一定程度上提高检索的准确性,但是仍然存在一些问题,例如需要大量的计算资源,训练时间较长等。
2、基于关键字的搜索方法依赖于用户提供的关键字,通过比较关键字与索引字段中的词汇是否匹配来确定搜索结果,但缺点是无法处理多义词、同义词和拼写错误等问题。另一种基于向量空间模型的搜索方法将文档表示为一组数值向量,通过对向量的运算来进行相似度检索,但缺点是无法处理复杂的语义关系,如上下文依赖和多义词等。基于机器学习的搜索方法使用机器学习算法建立查询与文档之间的关系模型,根据模型进行搜索,但缺点是需要大量的标注数据进行训练,且计算复杂度较高。
技术实现思路
1、本发明提供了一种问答方法、装置、电子设备及存储介质,以实现自动查询用户输入问题的答案定位,提高了预测答案准确率。
2、第一方面,本发明实施例提供了一种问答方法,该方法包括:
3、确定至少一个文本数据,并根据文本标题,对所述文本数据进行切块,得到至少一个文本块;
4、对所述文本块确定至少一个参考问题,并对所述文本块进行向量化,得到文本块向量,以及,对所述参考问题进行向量化,得到参考问题向量;
5、根据所述文本块向量和所述参考问题向量,确定向量数据库,并根据所述向量数据库,确定待回答问题的答案。
6、第二方面,本发明实施例还提供了一种问答装置,该装置包括:
7、文本数据切块单元,用于确定至少一个文本数据,并根据文本标题,对所述文本数据进行切块,得到至少一个文本块;
8、向量化确定单元,用于对所述文本块确定至少一个参考问题,并对所述文本块进行向量化,得到文本块向量,以及,对所述参考问题进行向量化,得到参考问题向量;
9、答案确定单元,用于根据所述文本块向量和所述参考问题向量,确定向量数据库,并根据所述向量数据库,确定待回答问题的答案。
10、第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的问答方法。
11、第四方面,本发明实施例还提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例中任一所述的问答方法。
12、本发明实施例的技术方案,通过对原始文本数据文本切块、文本块向量化、构建向量数据库为核心,将输入的文本数据生成多个参考问题并向量化生成向量数据库,从中确定待回答问题的答案,实现自动查询问答系统的用户交互界面输入问题的答案定位,提高了预测答案准确率。
13、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种问答方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定至少一个文本数据,包括:
3.根据权利要求1所述的方法,其特征在于,根据文本标题,对所述文本数据进行切块,得到至少一个文本块,包括:
4.根据权利要求3所述的方法,其特征在于,对所述文本数据进行文本标题识别,得到至少一个文本标题,包括:
5.根据权利要求1所述的方法,其特征在于,对所述文本块确定至少一个参考问题,包括:
6.根据权利要求1所述的方法,其特征在于,根据所述向量数据库,确定待回答问题的答案,包括:
7.根据权利要求6所述的方法,其特征在于,确定与所述待回答问题匹配的标准问题向量,包括:
8.一种问答装置,其特征在于,所述装置包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的问答方法。
10.一种存储计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的问答方法。