本申请涉及数据处理,特别是涉及一种基于数据库的内容查询方法和相关装置。
背景技术:
1、数据库用于存储多种内容,如文本、表格、视频等。而且,内容数量较多,且各种内容的文件名称会包括自定义词汇。
2、相关技术中,为了能够快速从数据库包括的多个内容中,查询到对象想要的内容,基于对象输入的查询语句和内容的标题进行匹配,将匹配度最高的内容作为查询结果返回给对象。
3、但是,由于文本匹配的方式较慢,从而导致查询速度较慢,且准确性较低。
技术实现思路
1、为了解决上述技术问题,本申请提供了一种基于数据库的内容查询方法和相关装置,用于提高针对数据库的内容的查询速度和准确性。
2、本申请实施例公开了如下技术方案:
3、一方面,本申请实施例提供一种基于数据库的内容查询方法,所述方法包括:
4、获取查询语句和所述查询语句的语义向量;
5、根据所述查询语句的语义向量和数据库中各个内容的语义向量,确定所述查询语句分别和各个所述内容的语义相似度;
6、根据所述查询语句分别和各个所述内容的语义相似度,从所述数据库包括的多个所述内容中,确定符合相似度条件的语义相似度分别对应的待定查询内容;
7、根据所述查询语句包括的文本分别和各个所述待定查询内容包括的文本之间的重合程度,确定所述查询语句分别和各个所述待定查询内容的文本相似度;
8、根据所述查询语句分别和各个所述待定查询内容的语义相似度,以及所述查询语句分别和各个所述待定查询内容的文本相似度,从多个所述待定查询内容中确定所述查询语句对应的查询内容。
9、另一方面,本申请实施例提供一种基于数据库的内容查询装置,所述装置包括:获取单元、语义相似度计算单元、筛选单元、文本相似度计算单元、查询单元;
10、所述获取单元,用于获取查询语句和所述查询语句的语义向量;
11、所述语义相似度计算单元,用于根据所述查询语句的语义向量和数据库中各个内容的语义向量,确定所述查询语句分别和各个所述内容的语义相似度;
12、所述筛选单元,用于根据所述查询语句分别和各个所述内容的语义相似度,从所述数据库包括的多个所述内容中,确定符合相似度条件的语义相似度分别对应的待定查询内容;
13、所述文本相似度计算单元,用于根据所述查询语句包括的文本分别和各个所述待定查询内容包括的文本之间的重合程度,确定所述查询语句分别和各个所述待定查询内容的文本相似度;
14、所述查询单元,用于根据所述查询语句分别和各个所述待定查询内容的语义相似度,以及所述查询语句分别和各个所述待定查询内容的文本相似度,从多个所述待定查询内容中确定所述查询语句对应的查询内容。
15、另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
16、所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
17、所述处理器用于根据所述计算机程序中的指令执行上述方面所述的方法。
18、另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。
19、另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。
20、由上述技术方案可以看出,获取查询语句以及查询语句的语义向量,根据查询语义的语义向量和数据库中各个内容的语义向量,确定查询语句分别和各个内容的语义相似度。根据多个语义相似度,从数据库包括的多个内容中确定符合相似度条件的语义相似度对应的内容,并将其作为待定查询内容,从而通过语义相似度从数据库中筛选出与查询语句在语义上较为相似的待定查询内容,且相比于数据库包括的多个内容,待定查询内容的数量较少,以降低后续用于文本匹配的内容的数量,提高查询速度。根据查询语句包括的文本和各个待定查询内容包括的文本之间的重合程度,确定查询语句分别和各个待定查询内容的文本相似度。根据查询语句分别和各个待定查询内容的语义相似度,以及查询语句分别和各个待定查询内容的文本相似度,从多个待定查询内容中确定查询语句对应的查询内容,从而得到与查询语句在语义上和文本上均较为相似的查询内容,提高了查询准确性。
21、由此,通过语义相似度降低了用于文本匹配的内容的数量,缩短了查询时间,提高了查询速度。而且,通过语义相似度和文本相似度结合,即结合查询语句的深层含义和表层特征进行查询,不仅适用于数据库中内容具有无语义的自定义文本的匹配,还可以考虑查询语句的语义,理解对象的语义意图,提高了相似度计算的准确性,以及查询的准确性。
1.一种基于数据库的内容查询方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述查询语句是基于目标账号生成的,则所述根据所述查询语句分别和各个所述待定查询内容的语义相似度,以及所述查询语句分别和各个所述待定查询内容的文本相似度,从多个所述待定查询内容中确定所述查询语句对应的查询内容,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述查询语句分别和各个所述待定查询内容的语义相似度、所述查询语句分别和各个所述待定查询内容的文本相似度,以及所述目标账号的热表信息,从多个所述待定查询内容中确定所述查询语句对应的查询内容,包括:
4.根据权利要求2所述的方法,其特征在于,所述根据所述查询语句分别和各个所述待定查询内容的语义相似度、所述查询语句分别和各个所述待定查询内容的文本相似度,以及所述目标账号的热表信息,从多个所述待定查询内容中确定所述查询语句对应的查询内容,包括:
5.根据权利要求1所述的方法,其特征在于,若所述数据库包括的内容为表格,则所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述查询语句是基于目标账号生成的,则所述根据所述查询语句的语义向量和数据库中各个内容的语义向量,确定所述查询语句分别和各个所述内容的语义相似度,包括:
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
8.根据权利要求1所述的方法,其特征在于,若所述数据库包括多个表格,则所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,若在根据所述编辑操作在所述数据库中进行更新的过程中,获取所述查询语句,则所述方法还包括:
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
11.根据权利要求8所述的方法,其特征在于,若所述查询语句对应的查询内容包括多个表格,则所述方法还包括:
12.一种基于数据库的内容查询装置,其特征在于,所述装置包括:获取单元、语义相似度计算单元、筛选单元、文本相似度计算单元、查询单元;
13.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1-11中任意一项所述的方法。
15.一种包括计算机程序的计算机程序产品,其特征在于,当其在计算机设备上运行时,使得所述计算机设备执行权利要求1-11中任意一项所述的方法。
