本申请涉及信息提取,尤其涉及一种基于正则算法的工单信息提取方法及系统。
背景技术:
1、客户投诉处理是企业与客户沟通的重要环节,它涉及从接收投诉、分析原因、解决问题到后续跟踪的一系列步骤,对企业具有极其重要的意义,它不仅是维护客户关系的必要手段,也是企业改进产品和服务、提升竞争力的关键途径。
2、传统投诉处理过程中,主要依靠人工客服进行信息记录和分类整理,然后再将任务指派给相关部门和人员进行处理,这种方法无法精准分析待分配工单需求与作业人员信息的匹配度,导致工单信息提取的准确性和可靠性较低,造成工单分配的准确性和可靠性较差,同时人工派单的作业方式速度较慢,影响了工单分配的效率。
3、综上所述,现有工单信息提取方法由于无法针对性地对待分配工单与作业人员属性进行精准匹配分析,导致待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题。
技术实现思路
1、本申请的目的是提供一种基于正则算法的工单信息提取方法及系统,用以解决现有工单信息提取方法由于无法针对性地对待分配工单与作业人员属性进行精准匹配分析,导致待分配工单与作业人员属性的分析匹配度较低,造成工单信息提取的准确性和可靠性较低的技术问题。
2、鉴于上述问题,本申请提供了一种基于正则算法的工单信息提取方法及系统。
3、第一方面,本申请提供了一种基于正则算法的工单信息提取方法,所述方法通过一种基于正则算法的工单信息提取系统实现,其中,所述方法包括:获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
4、第二方面,本申请还提供了一种基于正则算法的工单信息提取系统,用于执行如第一方面所述的一种基于正则算法的工单信息提取方法,其中,所述系统包括:参数类型标注模块,所述参数类型标注模块用于获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;作业人员分工采集模块,所述作业人员分工采集模块用于采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;正则表达式设定模块,所述正则表达式设定模块用于基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;匹配分类参数提取模块,所述匹配分类参数提取模块用于根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;多级正则表达式构建模块,所述多级正则表达式构建模块用于建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;工单信息获取模块,所述工单信息获取模块用于利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。
5、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
6、通过获取工单设置参数,对所述工单设置参数进行类型标注,其中,标注类型包括数字、时间、文本、网络链接;采集作业人员分工,包括作业人员时间分工、作业等级分工、作业类型分工;基于所述标注类型,对各工单设置参数进行聚类,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取;根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,提取各级别匹配分类参数,所述各级别匹配分类参数为多级分工决策树中各级分类的参数类别,所述参数类别包括作业人员时间、作业等级、作业类型;建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,其中,所述映射关系为所述参数类别与正则表达式中标注类型的一一映射关系;利用所述多级正则表达式生成提取模块,对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息。也就是说,通过基于标注类型对工单设置参数进行聚类,得到各聚类集群的正则表达式;另一方面根据作业人员时间分工、作业等级分工、作业类型分工配置多级分工决策树,提取获得各级别匹配分类参数;接着建立各级别匹配分类参数与各聚类集群的正则表达式的映射关系,并基于映射关系构建多级正则表达式;最后利用多级正则表达式对待分配工单信息进行内容提取及分工匹配,获取工单提取信息及工单匹配分工信息,可以提高待分配工单与作业人员属性分析的精细化程度,进而提高待分配工单与作业人员属性的适配度,达到确保工单信息提取的准确性和可靠性,进而提高工单分派的效率、准确性和可靠性的技术效果。
7、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其他特征将通过以下的说明书而变得容易理解。
1.基于正则算法的工单信息提取方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,对所述工单设置参数进行类型标注,包括:
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
4.如权利要求1所述的方法,其特征在于,设定各聚类集群的正则表达式,所述各聚类集群的正则表达式用于对各类型的工单内容进行对应提取,包括:
5.如权利要求1所述的方法,其特征在于,根据所述作业人员时间分工、作业等级分工、作业类型分工,配置多级分工决策树,包括:
6.如权利要求1所述的方法,其特征在于,建立所述各级别匹配分类参数与所述各聚类集群的正则表达式的映射关系,构建多级正则表达式,包括:
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
8.基于正则算法的工单信息提取系统,其特征在于,用于实施权利要求1至7中任意一项所述方法的步骤,所述系统包括:
