本发明涉及医疗诊断信息化,尤其涉及一种肿瘤患者新发时间确定方法和系统。
背景技术:
1、目前肿瘤医院系统均采用电子病历的形式进行患者病情和病程管理,电子病历包含患者基本信息、诊断信息、入出院记录、病程记录、手术记录等信息,通过对电子病历的信息挖掘,可以较为精准地判断肿瘤患者的新发时间和患病类型,对疑似新发患者的确诊时间进行验证。然而,由于电子病历数据体量较大,目前的数据挖掘只能采用人工审查的方式,无疑会浪费大量的时间和人力。借助计算机技术可大幅度提高工作效率,然而,电子病历存在大量的非结构化的文本类信息、专业名词众多、时间信息结构多样。并且,不同医疗机构和临床医生的电子病历的书写方式、语义表征均存在差别。因此,如何基于对接端口医疗机构的电子文本,快速、准确地提取出肿瘤患者的新发时间和患病类型是一项重要且困难的工作。
技术实现思路
1、本发明的目的是提供一种肿瘤患者新发时间确定方法和系统,基于提取的病例对应的主索引id和癌症全编码,将所有属于同一主索引id的病理数据进行汇总后提取所有病历的癌症编码,从而通过系统自动进行是否为仅患一种癌症或单癌种患者新发时间的推断,辅之人工审查系统判断的结果能够清晰准确并高效的基于电子文本提取出肿瘤患者是否为多原发患者和确定时间,为后续诊疗提供了可靠并且关键的信息。
2、本发明一方面提供了一种肿瘤患者新发时间确定方法,
3、s1,提取每个病例对应的主索引id;
4、s2,提取每个病例上的癌症全编码;
5、s3,将所有属于同一所述主索引id的病例数据进行汇总;其中,同一所述主索引id代表是同一患者,将所有同一主索引id的病例数据进行汇总是对同一患者相关病例信息的汇总;
6、s4,提取并汇总去重同一所述主索引id下所有病例的癌症编码;
7、s5,基于所述癌症编码和第二条件智能判断所述患者的新发时间。
8、优选的,所述s1包括:从数据库中提取患者的病例数据,并将其对应的主索引id进行标记和存储。
9、优选的,所述s2包括:
10、s21,提取病例中的诊断编码;
11、s22,根据第一条件筛选所述诊断编码作为所述癌症全编码。
12、优选的,所述第一条件包括:
13、(1)c码排除c78、c79、c80;
14、(2)7个d码的前三位为d32、d33、d42、d43、d45、d46、d47。
15、优选的,所述第二条件包括:针对同一主索引id下,患者出现一个癌症编码以及患者出现多个癌症编码的两个情况分别确定。
16、优选的,针对同一主索引id下,患者出现一个癌症编码的情况包括:若同一主索引id下,根据编码前3位判断规则,患者仅出现一个癌症编码,结合国际癌症组织标准,对多条病例判断的新发时间进行分析,其中,肿瘤新发时间的定义为患者为因癌症首次就诊或入院的日期;如果缺少相关病史资料,时间判断依次如下:①到医院、诊所或研究机构因怀疑肿瘤问题而首次就诊或入院的日期;②由临床医生首次诊断或由病理学家报告中提及肿瘤的日期;③死亡证明中获得癌症诊断情况下对应的死亡日期;④尸检首次发现癌症,在存活时未被怀疑过肿瘤情况下对应的尸检前的死亡日期;
17、若提取出不同规则下的新发时间,将基于规则的优先级判断,确定此次文本的新发时间及对应规则,若多条病例出现相同规则下多个患者新发时间,则比较患者的历次审查的新发时间;若新发时间<=6个月,则以最早的为准作为患者的新发时间,若新发时间>6个月,则判断异常;
18、针对同一主索引id下,患者出现多个癌症编码的情况包括:若同一主索引id下,患者出现多个癌症编码,则提取对应的所述主索引id及患者的全部病例信息。
19、优选的,对于疑似多原发患者,所述多原发患者确诊时间推断包括:基于主索引id获得所述患者的历次就诊病历文本;基于病理模式匹配病理名称,转出病理编码;基于所述患者全部的病理编码,进一步的判断新发时间。
20、本发明的第二方面在于提供一种肿瘤患者新发时间确定系统,实施第一方面提供的方法,包括:
21、第一提取模块(101),用于提取每个病例对应的主索引id;
22、第二提取模块(102),用于提取每个病例上的癌症全编码;
23、汇总模块(103),用于将所有属于同一所述主索引id的病例数据进行汇总;
24、第三提取模块(104),提取并汇总去重同一所述主索引id下所有病例的癌症编码;
25、判断模块(105),用于基于所述癌症编码和第二条件智能判断所述患者是否为多原发患者。
26、本发明的第三方面提供一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行如第一方面所述的方法。
27、本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如第一方面所述的方法。
28、本发明提供的方法、系统、电子设备以及计算机可读存储介质,具有如下有益的技术效果:
29、采用基于病历编码转化和疾病推断确定不同疾病发病时间,为后续的诊疗和其他电子文本的应用提供准确可靠的文本标注依据。
1.一种肿瘤患者新发时间确定方法,其特征在于,包括:
2.根据权利要求1所述的一种肿瘤患者新发时间确定方法,其特征在于,所述s1包括:
3.根据权利要求2所述的一种肿瘤患者新发时间确定方法,其特征在于,所述s2包括:
4.根据权利要求3所述的一种肿瘤患者新发时间确定方法,其特征在于,所述第一条件包括:
5.根据权利要求4所述的一种肿瘤患者新发时间确定方法,其特征在于,所述第二条件包括:针对同一主索引id下,患者出现一个癌症编码以及患者出现多个癌症编码的两个情况分别确定。
6.根据权利要求5所述的一种肿瘤患者新发时间确定方法,其特征在于,针对同一主索引id下,患者出现一个癌症编码的情况包括:若同一主索引id下,根据编码前3位判断规则,患者仅出现一个癌症编码,结合国际癌症组织标准,对多条病例判断的新发时间进行分析,其中,肿瘤新发时间的定义为患者为因癌症首次就诊或入院的日期;如果缺少相关病史资料,时间判断依次如下:①到医院、诊所或研究机构因怀疑肿瘤问题而首次就诊或入院的日期;②由临床医生首次诊断或由病理学家报告中提及肿瘤的日期;③死亡证明中获得癌症诊断情况下对应的死亡日期;④尸检首次发现癌症,在存活时未被怀疑过肿瘤情况下对应的尸检前的死亡日期;
7.根据权利要求6所述的一种肿瘤患者新发时间确定方法,其特征在于,对于疑似多原发患者,所述新发时间推断包括:基于主索引id获得所述患者的历次就诊病历文本;基于病理模式匹配病理名称,转出病理编码;基于所述患者全部的病理编码,进一步的判断新发时间。
8.一种肿瘤患者新发时间确定系统,用于实施权利要求1-7任一所述的方法,其特征在于,包括:
9.一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如权利要求1-7任一所述的方法。