本发明涉及问答处理,具体涉及基于知识库的问答处理系统。
背景技术:
1、随着互联网技术的快速发展,人们越来越习惯通过网络获取信息。在此基础上,问答系统受到了广泛关注并被大量研究和应用。其中,基于知识库的问答系统,以人工或构建的大规模知识库为信息源,能够回答常被人们提出的以知识、事实为基础的问题。
2、现有的一种基于知识库的问答处理系统应用在企业,企业通过构建其专属的知识库训练专属的问答模型,满足咨询用户对于企业的咨询服务要求,在此过程中,通过预设置几个常见的问题和答案来辅助快速回复咨询用户的咨询问题,减少企业问答模型的使用频率以此来降低搭载问答模型的服务器的负载,目前企业预设置的问题仅仅是针对很常见的问题,且出于减少冗余数据的考虑其数量通常不会太多,但是针对初次或者使用问答服务不多的咨询用户,其咨询的问题往往具有相似性,仅靠预设置问题无法满足其需求,且当存在与预设置的问题不相符的咨询问题,还是需要借助企业的问答模型去给予咨询用户最佳的回复答案,这使得企业的问答服务不合理;
3、为了解决上述问题,本发明提出了一种解决方案。
技术实现思路
1、针对现有技术的不足,本发明提供了基于知识库的问答处理系统,解决了背景技术中所提出的问题。
2、本发明的目的可以通过以下技术方案实现:
3、于知识库的问答处理系统,包括:
4、咨询端模块,用于咨询用户向企业进行问题咨询;
5、问答端模块,用于企业向咨询用户提供问答服务,所述问答端模块包括问答服务单元和预置服务单元,所述问答服务单元中存储有已经训练好的企业问答模型;
6、数据分析模块,对咨询用户的咨询问题和回复答案进行分析,生成第一、第二、...、第p5次登录的预置问题训练集和预置答案训练集;
7、问答服务单元,针对咨询用户第一、第二、...、第p5次登录时键入的咨询问题和企业问答模型对应输出的回复答案从其内提取出第一、第二、...、第p5次登录时的拆分特征,所述拆分特征包括词向量特征、句法和语义特征、关键词和实体特征、问题类型特征;
8、基于其从企业问答模型中提取出包含拆分特征权重参数,构建企业第一、第二、...、第p5次登录的微调问答小模型,并将第一、第二、...、第p5次登录的预置答案训练集作为对应次登录的小型问答知识库,所述p5为预设数值。
9、进一步的,数据分析模块,分析生成第一、第二、...、第p5次登录的预置问题训练集和预置答案训练集,具体如下:
10、s11:首先选定登录次数至少为p1次,且每次登录咨询的问题至少为p2个的咨询用户为待预置用户,所述p1和p2分别为预设值;
11、s12:获取一个待预置用户在第一次登录时键入的所有咨询问题,并依次标记为a1、a2、...、aa,a≥p2;
12、s13:针对所有待预置用户在第一次登录时键入的所有咨询问题,分别计算咨询问题a1与所有待预置用户在第一次登录时键入的所有咨询问题的相似度,并从中提取出与咨询问题a1的相似度至少在p3的所有咨询问题,所述p3为预设相似度阈值;
13、依据咨询问题a1和与咨询问题a1的相似度至少在p3的所有咨询问题构建该待预置用户基于第一次登录的一个咨询问题集;一个所述咨询问题集中的咨询问题至少为p4,所述p4为预设咨询问题数量阈值,获取咨询问题集中每一个咨询问题对应回复答案涉及的文本数据并依据其构筑该咨询问题集的答案文本集;
14、s14:依次计算咨询问题a1、a2、...、aa与所有待预置用户在第一次登录时键入的所有咨询问题的相似度并依据其按照s121到s122获取该预置用户基于第一次登录的所有咨询问题集和答案文本集;
15、s15:按照s11到s14,依次计算获取所有待预置用户基于第一次登录的所有咨询问题集和答案文本集,将所有待预置用户基于第一次登录的所有咨询问题集中的咨询问题汇总成一个集合,将该集合标定为第一次登录的预置问题训练集,将所有待预置用户基于第一次登录的所有答案文本集中的文本数据汇总成一个集合,将该集合标定为第一次登录的预置答案训练集;
16、s16:按照s11到s152依次生成第一、第二、...、第p5次登录的预置问题训练集和预置答案训练集。
17、本发明的有益效果:
18、本发明通过设置基础数据单元从企业内外部各类数据源中采集相关文本数据构建问答知识库,数据分析模块对咨询用户往期的咨询问题和回复答案进行分析获取大数据下咨询用户基于第一次、第二次、...、第p5次的预置问题训练集和预置答案训练集,由预置服务单元针对第一次、第二次、...、第p5次预置问题训练集中的咨询问题提取拆分特征来将企业问答模型拆分成对应的若干个小模型,并由其对应的预置问题训练集和预置答案训练集对拆分出的小模型进行训练得到第一次、第二次、...、第p5次微调问答小模型和其对应的小型问答知识库,预置服务单元对于使用问答服务次数少的咨询用户优先使用特定的微调问答小模型对其进行回复,通过这种方式,一方面摆脱了传统的预设几种问题的回复答案不全面的问题,另一方面针对初次或者使用问答服务次数不多的咨询用户基于其咨询问题的相似性优先使用训练的微调模型对其进行回复,提高了其回复答案的精准度和回溯速率,针对适应咨询次较多的咨询用户才通过问答模型对其进行回复,有效的降低了企业搭载问答模型的服务器的负载,减少了咨询端模块和问答端模块之间的网络流量。
1.基于知识库的问答处理系统,其特征在于,包括:
2.根据权利要求1所述的基于知识库的问答处理系统,其特征在于,所述问答端模块还包括基础数据单元,所述基础数据单元从企业内外部各类数据源中采集相关文本数据并基于其构建问答知识库,所述基础数据单元采集的相关文本数据包括企业内部数据、企业外部数据、内部专家知识数据和外部专家知识数据。
3.根据权利要求1所述的基于知识库的问答处理系统,其特征在于,咨询端模块包括若干个咨询单元,一个咨询单元对应一个咨询用户,咨询单元,用于对当前预咨询用户键入的登录账号和登录密码进行采集。
4.根据权利要求3所述的基于知识库的问答处理系统,其特征在于,所述预置服务单元中存储有所有咨询用户的账号名称、账号密码、登录次数、企业第一、第二、...、第p5次登录的微调问答小模型和其对应的小型问答知识库;
5.根据权利要求4所述的基于知识库的问答处理系统,其特征在于,咨询单元接收到传输的登录成功指令、第c1次登录的微调问答小模型和其对应的小型问答知识库后,获取当前预咨询用户本次登录键入的咨询问题,将其优先输入到第c1次登录的微调问答小模型中,由第c1次登录的微调问答小模型对该咨询问题进行分析并在其对应的小型问答知识库中进行检索返回与该咨询问题相关的多个答案,对返回的与该咨询问题相关的多个答案进行评分并判定;
6.根据权利要求4所述的基于知识库的问答处理系统,其特征在于,咨询单元只接收到登录成功指令后,获取当前预咨询用户本次登录键入的咨询问题将其传输到问答服务单元,由问答服务单元将该咨询问题输入到企业问答模型中进行分析返回与该咨询问题相关的多个答案并对其进行评分,选定分数最高的那个答案作为该咨询问题的回复答案传输到咨询单元,由咨询单元将其回复给当前预咨询用户进行查看。
7.根据权利要求1所述的基于知识库的问答处理系统,其特征在于,数据分析模块,分析生成第一、第二、...、第p5次登录的预置问题训练集和预置答案训练集,具体如下:
8.根据权利要求1所述的基于知识库的问答处理系统,其特征在于,所述企业问答模型用于对咨询用户的咨询问题进行语义分析提取关键词并基于其在问答知识库中检索与该咨询用户的咨询问题相关的信息并对应生成多个答案,对生成的多个答案进行评分,选定评分最高的答案生成符合该咨询用户针对该咨询问题的回复答案。
9.根据权利要求1所述的基于知识库的问答处理系统,其特征在于,所述问答服务单元拆分训练生成企业第一、第二、...、第p5次登录的微调问答小模型和其对应小型问答知识库,具体如下:
