本申请涉及医疗数据处理,尤其涉及一种基于大模型的医疗数据的标注方法、系统及介质。
背景技术:
1、在智慧医疗领域,数据标注扮演着至关重要的角色。医学图像标注和医学文本标注是其中的两个主要应用场景。医学图像标注用于标记医学图像中的病灶位置和大小等信息,帮助医生更准确地进行疾病诊断和治疗。而医学文本标注则用于标记医学文本中的关键词和病史等信息,有助于医生更快速地了解患者病情,提高医疗效率。
2、现有的进行医疗数据标注的方案主要有:一种医疗数据标注方法及装置、存储介质、电子设备,该方法包括:在预先设置的医学知识库中对目标字段名称进行匹配,得到与目标字段名称匹配的多个目标字段属性、多个目标属性值、各目标字段属性与各目标字段属性对应的目标属性值之间的目标显示逻辑;在待标注医疗数据中对各目标属性值进行匹配,得到各目标属性值在待标注医疗数据中的位置信息;根据各位置信息对应的各目标属性值,以及与各目标属性值对应的目标字段属性之间的目标显示逻辑,对位置信息进行筛选得到多个筛选结果。
3、现有进行医疗数据标注的方案主要为现有的学习算法直接运用,基于学习算法本身不可避免的误差范围,直接使用算法获得的筛选结果存在一定的误差,但是专家人工标注又较为耗时。
技术实现思路
1、针对现有技术的上述不足,本申请提供一种基于大模型的医疗数据的标注方法、系统及介质,以解决现有进行医疗数据标注的直接使用算法获得的筛选结果存在一定的误差,但是专家人工标注又较为耗时的问题。
2、第一方面,本申请提供了一种基于大模型的医疗数据的标注方法,方法包括:通过预设关键词提取界面,确定需求关键词;以根据需求关键词,确定联盟区块链名称和从医疗原始数据中提取对应的医疗处理数据;其中,医疗原始数据至少包括:电力病历数据、医学影像数据和实验室检测数据,需求关键词与联盟区块链名称之间具有映射关系;将医疗处理数据作为大模型的输入,获得初始标记结果;获取联盟区块链名称对应的节点数量,以将初始标记结果切分为小于等于节点数量个标记结果处理任务;基于联盟区块链名称,将标记结果处理任务广播至联盟区块链下的各个节点,以确定各个标记结果处理任务对应的处理节点;进而根据各处理节点广播的标记处理结果,获得初始标记结果对应的最终标记处理结果。
3、进一步地,通过预设关键词提取界面,确定需求关键词,具体包括:当预设关键词提取界面上任意预设关键词被触发时,确定对应的预设关键词为需求关键词。
4、进一步地,根据需求关键词,确定联盟区块链名称和从医疗原始数据中提取对应的医疗处理数据,具体包括:基于需求关键词与联盟区块链名称之间的预设映射关系,确定需求关键词对应的联盟区块链名称;将需求关键词作为关键数据提取算法的输入,以从医疗原始数据中提取对应的医疗处理数据。
5、进一步地,将医疗处理数据作为大模型的输入,获得初始标记结果,具体包括:通过大模型中的深度学习算法,识别进而提取出医学影像数据中的病灶区域图像;进而根据需求关键词对应的图片比对算法,确定病灶区域图像对应的相似度最高的样本图片,进而将相似度最高的样本图片中预设的标注数据作为当前病灶区域图像的标注数据;确定医学影像数据、病灶区域图像和标注数据为初始标记结果。
6、进一步地,将医疗处理数据作为大模型的输入,获得初始标记结果,具体还包括:通过大模型中的自然语言处理技术,对电力病历数据和实验室检测数据中的预设关键信息进行识别,以完成预设关键信息的标注,获得标注结果;确定电力病历数据和对应的标注结果、实验室检测数据和对应的标注结果为初始标记结果。
7、进一步地,根据各处理节点广播的标记处理结果,获得初始标记结果对应的最终标记处理结果,具体包括:当任一节点广播标记处理结果且存在任意两个节点对广播的标记处理结果验证成功时,确定标记处理结果合格;当任一节点广播标记处理结果且预设时间段内无节点对广播的标记处理结果验证不成功时,确定标记处理结果合格;当存在预设数量个节点对广播的标记处理结果验证不成功时,将标记处理结果对应的标记结果处理任务再次广播至全部联盟区块链下的各个节点,再次确定处理节点,直至确定标记处理结果合格;将合格的标记处理结果组合为最终标记处理结果。
8、第二方面,本申请提供了一种基于大模型的医疗数据的标注系统,系统包括:确定模块,用于通过预设关键词提取界面,确定需求关键词;以根据需求关键词,确定联盟区块链名称和从医疗原始数据中提取对应的医疗处理数据;其中,医疗原始数据至少包括:电力病历数据、医学影像数据和实验室检测数据,需求关键词与联盟区块链名称之间具有映射关系;切分模块,用于将医疗处理数据作为大模型的输入,获得初始标记结果;获取联盟区块链名称对应的节点数量,以将初始标记结果切分为小于等于节点数量个标记结果处理任务;获得模块,用于基于联盟区块链名称,将标记结果处理任务广播至联盟区块链下的各个节点,以确定各个标记结果处理任务对应的处理节点;进而根据各处理节点广播的标记处理结果,获得初始标记结果对应的最终标记处理结果。
9、进一步地,切分模块包括图片处理单元,用于通过大模型中的深度学习算法,识别进而提取出医学影像数据中的病灶区域图像;进而根据需求关键词对应的图片比对算法,确定病灶区域图像对应的相似度最高的样本图片,进而将相似度最高的样本图片中预设的标注数据作为当前病灶区域图像的标注数据;确定医学影像数据、病灶区域图像和标注数据为初始标记结果。
10、进一步地,获得模块包括结果处理单元,用于当任一节点广播标记处理结果且存在任意两个节点对广播的标记处理结果验证成功时,确定标记处理结果合格;当任一节点广播标记处理结果且预设时间段内无节点对广播的标记处理结果验证不成功时,确定标记处理结果合格;当存在预设数量个节点对广播的标记处理结果验证不成功时,将标记处理结果对应的标记结果处理任务再次广播至全部联盟区块链下的各个节点,再次确定处理节点,直至确定标记处理结果合格;将合格的标记处理结果组合为最终标记处理结果。
11、第三方面,本申请提供了一种非易失性计算机存储介质,其上存储有计算机指令,计算机指令在被执行时实现如上述任一项的一种基于大模型的医疗数据的标注方法。
12、本领域技术人员能够理解的是,本申请至少具有如下有益效果:
13、本申请涉及一种基于大模型的医疗数据的标注方法、系统及介质,通过确定需求关键词,进而可以确定具体的检索领域;本申请在此涉及联盟区块链的方案,涉及多个联盟区块链,通过需求关键词与联盟区块链之间的关系,能够在学习算法处理完数据后,将初始标记结果上传至联盟区块链中,进而将初始标记结果切分至若干任务下发至具体的检索领域对应的专家节点上,由于标记结果处理任务已经为初始标记结果,仅需少量的时间就可获得标记处理结果。解决了现有进行医疗数据标注的方案主要为现有的学习算法直接运用,基于学习算法本身不可避免的误差范围,直接使用算法获得的筛选结果存在一定的误差,但是专家人工标注又较为耗时的问题。
1.一种基于大模型的医疗数据的标注方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于大模型的医疗数据的标注方法,其特征在于,通过预设关键词提取界面,确定需求关键词,具体包括:
3.根据权利要求1所述的基于大模型的医疗数据的标注方法,其特征在于,根据需求关键词,确定联盟区块链名称和从医疗原始数据中提取对应的医疗处理数据,具体包括:
4.根据权利要求1所述的基于大模型的医疗数据的标注方法,其特征在于,将医疗处理数据作为大模型的输入,获得初始标记结果,具体包括:
5.根据权利要求1所述的基于大模型的医疗数据的标注方法,其特征在于,将医疗处理数据作为大模型的输入,获得初始标记结果,具体还包括:
6.根据权利要求1所述的基于大模型的医疗数据的标注方法,其特征在于,根据各处理节点广播的标记处理结果,获得初始标记结果对应的最终标记处理结果,具体包括:
7.一种基于大模型的医疗数据的标注系统,其特征在于,所述系统包括:
8.根据权利要求7所述的基于大模型的医疗数据的标注系统,其特征在于,切分模块包括图片处理单元,
9.根据权利要求7所述的基于大模型的医疗数据的标注系统,其特征在于,获得模块包括结果处理单元,
10.一种非易失性计算机存储介质,其特征在于,其上存储有计算机指令,所述计算机指令在被执行时实现如权利要求1-6任一项所述的一种基于大模型的医疗数据的标注方法。