本技术属于法律案情分析,尤其涉及一种案件辅助审判方法、装置、终端设备及介质。
背景技术:
1、基于人工智能技术的案件辅助审判方法及系统能够对海量案件进行处理提取关键信息并进行管理、分析,根据现实场景需求实现案件检索、经典案件推送、类案匹配等功能,以提升法院运转效率和效果。现有案件辅助审判方法一般是通过深度学习模型对案件进行大规模训练提取信息,再将其储存在关系数据库中通过结构化查询语句(sql,structured query language)进行遍历分析。然而,在信息提取方面,作为一种半结构文本,裁判文书行文通常具有一定的特征和规律,仅通过深度学习模型对文本进行直接处理会丢失案件知识关键特征,导致信息提取准确性和司法解释性不高;此外,现有案件辅助审判系统中检索、类案匹配、典型案件推送等功能一般是将案件储存在关系数据库管理系统(rdbms,relational database management system)中,主要是基于sql语句对各个部分案件信息进行遍历,进而实现检索等功能。但是,用于储存案件的数据库往往具有较大的规模,基于关系数据库所构建的辅助审判系统需在应用过程中重复索引、重复读取数据库,导致效率和准确性不高。
技术实现思路
1、本技术提供了一种案件辅助审判方法、装置、终端设备及介质,可以解决 传统案件辅助审判方法准确性低、解释性较差的问题。
2、第一方面,本技术提供了一种案件辅助审判方法,包括:
3、从预先构建的案件信息库中,提炼案件知识标签;案件信息库包括多份裁判文书,案件知识标签包括辅助审判知识标签和案件检索管理知识标签,辅助审判知识标签用以指示适用于辅助审判方法、具有法律依据的知识标签,案件检索管理知识标签用于指示适用于精细化检索的多维知识标签,案件知识标签与裁判文书一一对应;
4、根据多份裁判文书的文本结构特征,构建用于划分裁判文书文本结构的文书结构抽取规则,并根据文书结构抽取规则分别对多份裁判文书进行划分,得到结构化数据集;
5、根据案件知识标签,构建实体识别规则,并根据实体识别规则对结构化数据集进行识别,得到案件实体集;识别规则包括用于识别文本结构的文本结构实体识别规则、用于识别案件知识标签中断言词的零宽断言实体识别规则以及用于识别案件知识标签中判断词的判断语句实体识别规则,案件实体集包括多个案件实体,案件实体与裁判文书一一对应;
6、根据预先设计的案件关系集和案件实体集,构建案件知识图谱;
7、分别计算案件知识图谱中各案件实体的影响度,并根据影响度,从案件实体集中确定至少一个典型案件实体;
8、分别计算待审判案件与每个典型案件实体之间的相似度,并根据相似度确定至少一个匹配案件;匹配案件表示与待审判案件相似的典型案件实体;
9、分别计算每个匹配案件的匹配得分,并根据最高匹配得分对应的典型案件实体的裁判文书,对待审判案件的主刑进行预测,实现案件辅助审判。
10、可选的,辅助审判知识标签包括犯罪事实、从轻因素、从重因素、判决依据以及判决结果;
11、案件检索管理知识标签包括案件类型、案号、具体案由、归属省份、审理法院、主要审判人员、判决日期、被告人姓名、被告人职业、被告人文化程度、被告人民族、被告人性别。
12、可选的,文书结构抽取规则的表达式如下:
13、首部:从文本中匹配“审理终结”、“指控”为后断言词,获取后断言词之前的内容作为首部部分;
14、事实:从文本中匹配“审理终结”、“指控”为前断言词,依照顺序从文本中匹配“本院认为”、“本庭认为”、“本合议庭认为”为后断言词,获取前后断言词之间的内容作为事实部分;
15、理由:从文本中匹配“本院认为”、“本庭认为”、“本合议庭认为”为前断言词,从文本中匹配“判决如下”为后断言词,获取前后断言词之间的内容作为理由部分;
16、主文:从文本中匹配“判决如下”为前断言词,依照顺序从文本中匹配“如不服本判决”、“审判”为后断言词,获取前后断言词之间的内容作为主文部分;
17、尾部:从文本中匹配“如不服本判决”、“审判”为前断言词,获取前断言词之后的内容作为尾部部分。
18、可选的,根据实体识别规则对结构化数据集进行识别,得到案件实体集,包括:
19、针对文本结构实体识别规则,通过将每个裁判文书的文书内容转换成list形式,并以段落作为间隔,得到列表,为当前文书的第i段内容,为审理法院实体,为案件类型实体,为案号实体;
20、针对零宽断言实体识别规则,通过获取每个案件知识标签中的断言词,构建案件知识标签对应的正则匹配式;通过正则匹配式提取特定断言词之前、之后或者两个断言词之间的特定内容,如具体案由可将“犯”作为前断言词,“罪”为后断言词抽取当前案件的具体案由,即被告人罪名。
21、针对判断语句实体识别规则,通过预定义实体内容并构建知识标签判断词,将判断为true的知识标签映射为预定义内容。
22、可选的,影响度的计算公式如下:
23、;
24、其中,表示第案件实体在时刻的影响度,表示阻尼系数,表示案件实体的传入邻点,表示的传出邻点,表示评价出度,即从当前实体发出的边的数量。
25、可选的,分别计算待审判案件与每个典型案件实体之间的相似度,并根据相似度确定至少一个匹配案件,包括:
26、分别将待审判案件和每个典型案件实体向量化;
27、通过计算公式
28、;
29、得到待审判案件与典型案件实体之间的相似度;其中,表示所计算相似度的实体对象,表示所计算相似度的实体向量,表示当前实体的向量维度,表示当前向量矩阵的第维向量;
30、将相似度大于等于预设相似度阈值对应的典型案件实体,确定为待审判案件的匹配案件。
31、可选的,匹配得分的计算公式如下:
32、;
33、;
34、其中,表示所述待审判案件的向量与所述匹配案件的向量之间的匹配得分,表示所述判决结果对应的向量。
35、第二方面,本技术提供了一种案件辅助审判装置,包括:
36、标签模块,用于从预先构建的案件信息库中,提炼案件知识标签;案件信息库包括多份裁判文书,案件知识标签包括辅助审判知识标签和案件检索管理知识标签,辅助审判知识标签用以指示适用于辅助审判方法、具有法律依据的知识标签,案件检索管理知识标签用于指示适用于精细化检索的多维知识标签,案件知识标签与裁判文书一一对应;
37、抽取规则模块,用于根据多份裁判文书的文本结构特征,构建用于划分裁判文书文本结构的文书结构抽取规则,并根据文书结构抽取规则分别对多份裁判文书进行划分,得到结构化数据集;
38、识别规则模块,用于根据案件知识标签,构建实体识别规则,并根据实体识别规则对结构化数据集进行识别,得到案件实体集;识别规则包括用于识别文本结构的文本结构实体识别规则、用于识别案件知识标签中断言词的零宽断言实体识别规则以及用于识别案件知识标签中判断词的判断语句实体识别规则,案件实体集包括多个案件实体,案件实体与裁判文书一一对应;
39、知识图谱模块,用于根据预先设计的案件关系集和案件实体集,构建案件知识图谱;
40、典型案件确定模块,用于分别计算案件知识图谱中各案件实体的影响度,并根据影响度,从案件实体集中确定至少一个典型案件实体;
41、匹配案件确定模块,用于分别计算待审判案件与每个典型案件实体之间的相似度,并根据相似度确定至少一个匹配案件;匹配案件表示与待审判案件相似的典型案件实体;
42、辅助审判模块,用于分别计算每个匹配案件的匹配得分,并根据最高匹配得分对应的典型案件实体的裁判文书,对待审判案件的主刑进行预测,实现案件辅助审判。
43、第三方面,本技术提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的案件辅助审判方法。
44、第四方面,本技术提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的案件辅助审判方法。
45、本技术的上述方案有如下的有益效果:
46、本技术提供的案件辅助审判方法,根据多份裁判文书的文本结构特征,构建文书结构抽取规则,利用了裁判文书半结构化的特性,能够准确对裁判文书的文本结构进行划分,增强了结构化数据的可解释性,从而提高案件辅助审判的准确性;通过分别计算待审判案件与其他案件之间的相似度和匹配得分,能进一步筛选出与待审判案件最相似的案件,减小其他不相干案件带来的干扰,减小流程工作量的同时,提高了案件辅助审判的准确性。
47、本技术的其它有益效果将在随后的具体实施方式部分予以详细说明。
1.一种案件辅助审判方法,其特征在于,包括:
2.根据权利要求1所述的案件辅助审判方法,其特征在于,所述辅助审判知识标签包括犯罪事实、从轻因素、从重因素、判决依据以及判决结果;
3.根据权利要求1所述的案件辅助审判方法,其特征在于,所述文书结构抽取规则的表达式及思路如下:
4.根据权利要求1所述的案件辅助审判方法,其特征在于,所述根据所述实体识别规则对所述结构化数据集进行识别,得到案件实体集,包括:
5.根据权利要求1所述的案件辅助审判方法,其特征在于,所述影响度的计算公式如下:
6.根据权利要求1所述的案件辅助审判方法,其特征在于,所述分别计算待审判案件与每个典型案件实体之间的相似度,并根据所述相似度确定至少一个匹配案件,包括:
7.根据权利要求1所述的案件辅助审判方法,其特征在于,所述匹配得分的计算公式如下:
8.一种案件辅助审判装置,其特征在于,包括:
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的案件辅助审判方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的案件辅助审判方法。
