本发明涉及医疗数据管理,具体涉及基于大数据的医疗信息数据智能化管理方法及系统。
背景技术:
1、对医疗信息数据对于医疗系统的高效运作、临床决策的支持以及医疗研究的推进都起着关键作用。医疗信息数据管理可以收集和整合临床数据、患者数据、医疗设备数据等,进行数据分析和挖掘。通过这些数据分析,医疗机构可以预测疾病发展趋势、优化资源分配、改进临床流程、制定策略和政策等。医疗信息数据管理还可以提供医学知识库、决策支持系统等工具,帮助医生和其他医疗人员做出更准确、全面的临床决策,医疗信息数据还可以促进医疗团队的协同工作和信息共享。故对医疗信息数据管理的必要性是显而易见的,它不仅有助于提高医疗质量的效率,还可以为医学研究和科学进展提供重要的支持。
2、为了帮助医学生了解医疗信息数据相关知识,使用用户的体征向量对医学生进行教学,使得医学生能够清晰了解医疗信息数据相关知识,通常情况下,教师直接使用医疗信息数据中用户的体征向量直接对医学生进行教学,由于体征向量通常可以分为两种,为了使得医学生可以更清楚的了解医疗信息数据,需要对用户的体征向量进行分类。但是常规的adaboost算法在对用户的体征向量进行分类时,是通过基分类器的分类误差率计算基分类器的权重系数直接对分类器进行迭代更新,其中,分类误差率是直接所有基分类器判断错误的样本的权重之和,其没有结合对实际的用户错分情况进行判断,主要考虑的是整体分类效果,没有引入针对个人的分类效果的引导,导致该adaboost算法难以达到一个很高的分类精度。
技术实现思路
1、为了解决adaboost算法对医疗信息数据进行分类时,主要考虑的是整体分类效果,没有引入针对个人的分类效果的引导,导致该adaboost算法难以达到一个很高的分类精度的技术问题,本发明的目的在于提供基于大数据的医疗信息数据智能化管理方法及系统,所采用的技术方案具体如下:
2、第一方面,本发明一个实施例提供了一种基于大数据的医疗信息数据智能化管理方法,该方法包括以下步骤:
3、获取用户的体征向量;
4、将所述用户的体征向量输入训练好的集成分类器中,得到辅助学习管理的标签;
5、其中,集成分类器的训练过程为:通过adaboost算法对历史的体征向量进行分类,得到分类结果;基于分类结果中对单个用户的体征向量错分情况和多个用户的用户错分情况,确定分类器的个体区分率;将所述个体区分率作为adaboost算法中基分类器的权重系数的乘积系数,更新adaboost算法中基分类器的权重系数,通过不断迭代计算,得到最终的集成分类器。
6、优选的,所述个体区分率的计算公式为:
7、;
8、其中,q为个体区分率;e为自然常数;a为分类器的错分样本对应的用户数量;b为分类器的样本对应的用户总数量;为第一错分度;为第二错分度;为取绝对值符号。
9、优选的,所述第一错分度的获取方法为:
10、将健康错分为不健康的错分样本所对应的用户,由这些用户构成一个序列,记为第一用户序列;
11、将第一用户序列中每个用户元素对应的将健康错分为不健康的错分样本数量,所有的错分样本数量形成的序列,记为第一错分样本数量序列;
12、对第一错分样本数量序列中的元素按照从小到大的顺序排列,得到第一错分升序序列;
13、对第一错分升序序列进行分割,得到多个第一分割段;
14、计算每个第一分割段内元素的均值,记为第一分割均值;将第一分割均值最大的第一分割段作为第一极限分割段;
15、对第一分割段的浮动程度、第一极限分割段与第一分割段的差异进行分析确定第一错分度。
16、优选的,所述第一错分度的计算公式为:
17、;
18、其中,为第一错分度;为求方差符号;为除第一极限分割段外第一个所述第一分割段的第一分割均值;为第一除极限分割段外第二个第一分割段的第一分割均值;为除第一极限分割段外第三个第一分割段的第一分割均值;为除第一极限分割段外第个第一分割段的第一分割均值;为除第一极限分割段外其他第一分割段的第一分割均值的方差;g为第一极限分割段的第一分割均值;为的方差。
19、优选的,所述对第一错分升序序列进行分割,得到多个第一分割段,包括:
20、对第一错分升序序列中的元素通过otsu多阈值分割的方法可以得到多个第一分割值,多个第一分割值将第一错分升序序列分割为多个第一分割段。
21、优选的,所述第二错分度的获取方法为:
22、将不健康错分为健康的错分样本所对应的用户,由这些用户构成一个序列,记为第二用户序列;
23、将第二用户序列中每个用户元素对应的将不健康错分为健康的错分样本数量,所有的错分样本数量形成的序列,记为第二错分样本数量序列;
24、对第二错分样本数量序列中的元素按照从小到大的顺序排列,得到第二错分升序序列;
25、对第二错分升序序列进行分割,得到多个第二分割段;
26、计算每个第二分割段内元素的均值,记为第二分割均值;将第二分割均值最大的第一分割段作为第二极限分割段;
27、对第二分割段的浮动程度、第二极限分割段与第二分割段的差异进行分析确定第二错分度。
28、优选的,所述第二错分度的计算公式为:
29、;
30、其中,为第二错分度;为求方差符号;为除第二极限分割段外第一个所述第二分割段的第二分割均值;为第二除极限分割段外第二个第二分割段的第二分割均值;为除第二极限分割段外第三个第二分割段的第二分割均值;为除第二极限分割段外第n-1个第二分割段的第二分割均值;为除第二极限分割段外其他第二分割段的第二分割均值的方差;h是最大的第二分割均值,也即第二极限分割段的第二分割均值;为的方差。
31、优选的,所述对第二错分升序序列进行分割,得到多个第二分割段,包括:
32、对第二错分升序序列中的元素通过otsu多阈值分割的方法可以得到多个第二分割值,多个第二分割值将第二错分升序序列分割为多个第二分割段。
33、优选的,所述分类结果中标签0表示健康状态,标签1表示不健康状态。
34、第二方面,本发明一个实施例提供了一种基于大数据的医疗信息数据智能化管理系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于大数据的医疗信息数据智能化管理方法。
35、本发明实施例至少具有如下有益效果:
36、相较于传统方法中,adaboost算法对医疗信息数据进行分类时,主要考虑的是整体分类效果,没有引入针对个人的分类效果的引导,导致该adaboost算法难以达到一个很高的分类精度的技术问题。基于此,本发明实施例基于每个基分类器的分类结果,对个体用户进行进一步分析,通过计算每个基分类器的个体区分率,作为每个基分类器的错误率修正系数,以对传统的基分类器误差率进行修正,进而增强集成分类器的个体区分能力,使得集成分类器更多地聚焦于个人健康状态的正确区分,最终的集成分类器对单个用户的健康与否状态的区分能力可以达到一个较高的识别精度,提高分类器的上限,大大提高了集成分类器的分类精度,使得在对医学生进行教学时,使医学生能够更清楚的了解医疗信息数据及其分类。
1.一种基于大数据的医疗信息数据智能化管理方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述个体区分率的计算公式为:
3.根据权利要求2所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述第一错分度的获取方法为:
4.根据权利要求3所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述第一错分度的计算公式为:
5.根据权利要求3所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述对第一错分升序序列进行分割,得到多个第一分割段,包括:
6.根据权利要求2所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述第二错分度的获取方法为:
7.根据权利要求6所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述第二错分度的计算公式为:
8.根据权利要求6所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述对第二错分升序序列进行分割,得到多个第二分割段,包括:
9.根据权利要求1所述的基于大数据的医疗信息数据智能化管理方法,其特征在于,所述分类结果中标签0表示健康状态,标签1表示不健康状态。
10.一种基于大数据的医疗信息数据智能化管理系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~9中任意一项所述一种基于大数据的医疗信息数据智能化管理方法的步骤。
