一种医疗数据智能化可视分析管理的方法

专利检索2025-01-25  8


本发明涉及医疗数据管理,尤其涉及一种医疗数据智能化可视分析管理的方法。


背景技术:

1、随着医疗信息系统的广泛应用,越来越多的电子病历数据可用于记录患者病情和疾病发展,然而,由于医疗大数据的多源性、高维性和异构性,医院很难对其进行全面及精细化地管理,此外,医疗数据的日益庞大导致快速及时识别异常医疗数据也是一项难题,因此,具有更好视觉表现和交互性的可视化工具仍然是支持医疗数据管理任务所必需的。

2、然而,现有的医疗数据可视化方法然虽然展示了病历大量的诊疗数据,但在复杂数据可视化和可扩展性方面仍有改进的空间,因为大多数病历的数据有着分散、高维,内部结构复杂的特点,例如,实验室测试项目达到了数千项,基因也有数十项,另外还有病理、手术和其他种类的数据,更重要的是,不同时间戳的组合使病历数据的维度达到数千甚至数万,此外,这些数据还包含大量医生手写的非结构化数据,导致数据高度异构,所以一个高效的可视化方法可以大大提高医疗数据的管理能力,因此复杂医疗数据的可视化方法研究成为了一项亟待解决的问题。

3、文献号为cn111312345a的专利文献公开一套支持医疗数据智能可视化展示的方法及装置,可一种医疗数据智能化可视分析管理的方法应用于各类医疗数据分析报告或者可视化展示一种医疗数据智能化可视分析管理的方法需求下的决策支持场景。其中,所述方法包括:首一种医疗数据智能化可视分析管理的方法先获取来自数据库或者上传的医疗数据集;其一种医疗数据智能化可视分析管理的方法次,对获取到的医疗数据集进行降维,并对不同一种医疗数据智能化可视分析管理的方法类型的数据项进行分类;然后,基于降维后数据一种医疗数据智能化可视分析管理的方法集特点,判断数据集所处的医疗场景,并匹配相一种医疗数据智能化可视分析管理的方法应的可视化图表类型;最后,对选中的数据项进一种医疗数据智能化可视分析管理的方法行可视化图表的可视化处理,得到可视化图表。一种医疗数据智能化可视分析管理的方法与现有的技术相比,本发明提供了医疗数据可视一种医疗数据智能化可视分析管理的方法化的方法,辅助医疗数据分析和管理决策更好地一种医疗数据智能化可视分析管理的方法进行。

4、但该方法存在:1、对非结构化数据无法进行可视化管理分析;2、不能层次化的方式展示病历数据;3、可视化的数据不够显示形象直观。


技术实现思路

1、本发明的目的在于提供一种医疗数据智能化可视分析管理的方法,实现对医疗数据可视化分析管理。

2、本发明的目的可以通过以下技术方案实现:一种医疗数据智能化可视分析管理的方法,包括以下步骤:

3、s1、收集病历原始数据,根据原始数据类型,将原始数据分为非结构化数据、结构化数据和疗效评估数据;

4、s2、对非结构化数据进行预处理,获取病历文本数据,对文本数据进行处理,获取病历非结构化数据项目文本观察词及相应的概率分布;

5、s3、对结构化数据进行处理,获取病历结构化数据项目归一化后的值以及偏离方向;

6、s4、收集疗效评估数据;

7、s5、使用可视化框架展示分析疗效评估数据、病历非结构化数据项目和结构化数据项目处理后的数据。

8、进一步地:所述原始数据类型包括数值型、布尔型、编码型、分类型和文本型;

9、其中数值型、布尔型和分类型为结构化数据类型,文本型为非结构化数据类型,编码型为疗效评估数据。

10、进一步地:所述步骤s2中对非结构化数据进行预处理包括:删除非结构化数据中不相关的数字字符、特殊字符、jieba分词和删除停止词。

11、进一步地:所述s2中对文本数据进行处理,获取病历非结构化数据项目文本观察词及相应的概率分布的步骤包括:

12、s21、获取m份病历文档,wi(i=1,2,…,m)表示第i个文档,则所有文档集表示为d={w1,...,wi,...,wm};划定每份文档有n个项目观察词,文档w表示为w={w1,...,wj,...,wn},wj(j=1,2,…,n)表示文档wi中第j个项目观察词;划定k个主题,则主题集表示为z={z1,...,zk,...,zk},其中zk(k=1,2,…,k)表示第k个主题;

13、s22、利用lda模型,用公式(1)计算变量的联合概率分布:

14、

15、其中,α表示每个主题分布的先验狄利克雷分布的超参数;β表示每个项目观察词分布的先验狄利克雷分布的超参数;θ表示文档-主题的概率分布;φ表示主题-项目观察词的概率分布,z表示主题;w表示病历文档;

16、s23、使用积分求和,获取w的生成概率公式(2);

17、

18、s24、利用最大化对数似然函数logp(w|α,β)求解先验参数α和β,引入变分分布p(θ,z,φ|w,α,β)来逼近真实的后验分布q(θ,z,φ|γ,φ,λ),对数似然函数logp(w|α,β)表示为公式(3);

19、

20、其中l(γ,φ,λ|α,β)表示logp(wα,β)的对数似然的下界,d(q||p)表示kullback-leibler散度,测量两个分布的相似性;

21、s25、用l(γ,φ,λ|α,β)近似logp(w|α,β),在em算法e步中最大化l(γ,φ,λ|α,β)求解最优变化参数γ,φ,λ。

22、变化参数γ,φ,λ更新为

23、

24、

25、

26、其中,φnk表示文档w中的第n个项目观察词由主题k生成的概率,则是文档w中主题k生成的项目观察词数的估计值,文档w的主题的θm分布为

27、

28、进一步地:所述s21中划定每份文档主题数量的依据为困惑度,所述困惑度的计算公式为:

29、

30、其中,其中ni表示第i个文档中的项目观察词数量,p(wi)表示第i个项目观察词的概率。

31、进一步地:所述s3中对结构化数据进行处理,获取病历结构化数据项目归一化后的值以及偏离方向的步骤包括:

32、s31、获取m份病历结构化数据,si(i=1,2,…,m)表示第i个病历结构化数据,则所有病历结构化数据表示为s={s1,...,si,...,sm};

33、s32、通过z-score分数将第i个病历结构化数据项目归一化为一对(zi,di),其中zi是项目偏离正常范围的幅度,di是偏离的方向,项目变量正常范围内的所有值均归一化为零,refi(min)表示项目最小参考值,refi(max)表示项目最大参考值;

34、s33、计算第i个病历结构化数据si项目的幅度和方向;

35、

36、其中μi是si的平均值,σi是μi和si的标准差,zi幅值为|z'(si)|,方向di定义为1、0和-1,取决于z'(si)是正、零还是负。

37、进一步地:所述s4中疗效评估数据收集包括以下步骤:

38、s21、从原始医嘱中收集具有疗效评估的cr、pr、sd和pd数据;

39、s12、通过与专业医生沟通,收集患者用药前后的影像学数据以及相关的实验室测试数据,判断疗效结果,并根据疗效结果收集具有疗效评估的cr、pr、sd和pd数据。

40、进一步地:所述s5中使用可视化框架展示分析疗效评估数据、病历非结构化数据项目和结构化数据项目处理后的数据包括:

41、区域a展示了病历的基本信息;

42、区域b展示了病历历次入院诊疗的时间戳;

43、区域c根据预先定义顺序来展示病历非结构化数据项目检查结果和结构化数据项目检查结果;

44、区域d显示疗效评估数据;

45、区域g显示病历的非结构化数据项目中依概率分布获取的文本观察词;

46、区域h展示病历的结构化数据检查结果子项数据;

47、区域i展示了区域h子项数据每个检查结果的历史变化。

48、进一步地:所述区域c展示病历非结构化数据项目检查内容结果及结构化数据项目检查内容结果包括:

49、非结构化数据项目检查内容包括放疗、手术、体格检查、病理和影像;

50、非结构化数据项目检查结果包括正常、异常和未做;

51、结构化数据项目包括症状、病史、血常规、dic全套、生化和基因;

52、结构化数据项目检查结果包括偏高项、偏低项、正常、偏高和偏低汇总项和未做项。

53、进一步地:所述结构化数据项目检查结果判断依据为:

54、

55、其中,count(di=-1)表示第j个类别的项数状态等于-1,count(di=1)表示第j个类别的项数状态等于1,di是第j个分类的第i个项的方向。

56、本发明的有益效果:

57、1、本发明通过对非结构化数据计算出数据中所有词汇的概率分布;对结构化数据通过z分数的方法将所有数据归一化到一个空间,经过处理后所有数据的归一化表示,兼顾了病历数据的多源异构复杂性,根据不同的数据特征和类型,基于主题模型挖掘出非结构化数据中潜在语义,提高异常数据的检测能力,提升医疗数据管理能力,可以全方位可视化病历数据。

58、2、本发明采用层次化的方式展示病历数据,对病历的项目展示按字体大小展示所占概率权重,对非结构化的放疗、手术、体格检查、病理、影像区分检查内容和检查结果进行展示,对症状、病史、血常规、dic全套、生化和基因;等结构化数据区分检查内容、检查结果、检查分项进行层次化展示,有利于管理病历数据的分层管理。

59、3、本发明数据智能可视化的方法,可以灵活应用于各类医疗数据管理、医院管理场景,使用不同的可视化方法来呈现这些不同类型的数据,方便对病历检查结果按类别进行划分,根据结果是否异常,对异常项目进行汇总统计;对所有检查类别获得的结果进行离散化,得到每个类别的总体状态和各个子项的具体状态;使用统一的显示方法来展示这些离散化后的数据;并采用词云图、矩形树图、带有时间的折线图以及一些特殊设计的图标来可视化病历的所有数据,病历数据显示形象直观。


技术特征:

1.一种医疗数据智能化可视分析管理的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述原始数据类型包括数值型、布尔型、编码型、分类型和文本型;

3.根据权利要求1所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述步骤s2中对非结构化数据进行预处理包括:删除非结构化数据中不相关的数字字符、特殊字符、jieba分词和删除停止词。

4.根据权利要求1所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述s2中对文本数据进行处理,获取病历非结构化数据项目文本观察词及相应的概率分布的步骤包括:

5.根据权利要求4所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述s21中划定每份文档主题数量的依据为困惑度,所述困惑度的计算公式为:

6.根据权利要求1所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述s3中对结构化数据进行处理,获取病历结构化数据项目归一化后的值以及偏离方向的步骤包括:

7.根据权利要求1所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述s4中疗效评估数据收集包括以下步骤:

8.根据权利要求1所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述s5中使用可视化框架展示分析疗效评估数据、病历非结构化数据项目和结构化数据项目处理后的数据包括:

9.根据权利要求8所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述区域c展示病历非结构化数据项目检查内容结果及结构化数据项目检查内容结果包括:

10.根据权利要求9所述的一种医疗数据智能化可视分析管理的方法,其特征在于:所述结构化数据项目检查结果判断依据为:


技术总结
本发明公开了一种医疗数据智能化可视分析管理的方法,根据原始数据的形式将数据分为非结构化数据和结构化数据;对非结构化数据进行清洗、分词等预处理,通过主题模型获得文本观察词的概率分布;对结构化数据进行预处理,获得归一化后的值以及偏离方向;使用可视化框架展示分析上述预处理过后的数据。本发明通过对非结构化数据计算文本观察词和权重;对结构化数据通过Z分数将所有数据归一化到一个空间,兼顾了病历数据的多源异构复杂性,根据不同的数据特征和类型,提升医疗数据管理能力,可以全方位可视化病历数据。

技术研发人员:朱伟伟,王红强,谢新平,周鹏,余学芳
受保护的技术使用者:中国科学技术大学
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1149070.html

最新回复(0)