本发明涉及生物信息,尤其涉及一种生物安全数据库管理方法和系统。
背景技术:
1、传统的生物安全数据管理方法主要依赖于人工收集和分类数据,造成效率低下,并且容易出错,对生物安全性管理也存在局限性,难以应对大规模数据处理的需求。尽管有一些系统尝试根据生物数据推荐管理决策,但这些系统无法深入考虑到各因素对管理决策选择的影响,例如对生物本质作用机制探究不足、特征识别不充分等导致无法准确捕捉数据的特性和规律,从而不能高效精准匹配管理机制,在生物安全数据量爆炸性增长的当下,需要一种新的方法,实现对生物安全管理数据的精准高效管理。
技术实现思路
1、(1)要解决的技术问题
2、本发明的目的在于提供一种生物安全数据库管理方法和系统,通过考虑生物本质作用机制、深入特征分析,实现高效精准的生物安全数据检测评估,从而高效精准匹配管理机制。
3、(2)技术方案
4、为实现上述目的,一方面,本发明提供了一种生物安全数据库管理方法,所述方法包括:
5、获取生物安全目标数据,所述生物安全目标数据包括生物安全目标元件;
6、将所述生物安全目标数据进行分类得到生物安全目标类别数据;
7、根据生物安全目标类别数据获取生物安全目标类别数据的作用机制关键信息片段,将生物安全目标类别数据的作用机制关键信息片段加载至生物反应单元路径结构化模型得到生物安全目标类别数据反应单元路径;
8、从生物安全目标类别数据反应单元路径提取生物安全目标类别数据反应单元路径事件,对生物安全目标类别数据反应单元路径事件进行生物安全风险标志事件检测得到生物安全目标类别第一特征数据;
9、获取生物安全目标类别第二特征,将生物安全目标类别第一特征数据、第二特征数据输入安全风险诊断模型得到生物安全目标数据风险标签,基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制。
10、在第一方面的一种可能的实施方式中,所述将所述生物安全目标数据进行分类得到生物安全目标类别数据,包括:
11、对生物安全目标数据进行数据清洗得到生物安全标准化文本数据;
12、通过tf-idf向量化生物安全标准化文本数据得到生物安全向量化文本特征;
13、将生物安全向量化文本特征根据svm算法进行分类得到生物安全目标类别数据。
14、在第一方面的一种可能的实施方式中,所述获取生物安全目标类别数据的作用机制文本信息,将生物安全目标类别数据的作用机制文本信息加载至生物反应单元路径结构化模型得到生物安全目标类别数据反应单元路径,包括:
15、将生物安全目标类别数据定义为生物安全目标关键词组,根据生物安全目标关键词组在生物安全文献数据库中检索获取文献文本;
16、通过使用ner命名实体识别技术识别文献文本中的关键实体,并通过依存句法分析对文本进行处理提取生物安全目标类别数据的作用机制关键信息片段;
17、将生物安全目标类别数据的作用机制关键信息片段加载至生物反应单元路径结构化模型得到生物安全目标类别数据反应单元路径。
18、在第一方面的一种可能的实施方式中,所述生物反应单元路径结构化模型是能够表示生物反应单元及其路径的数据结构,包含生物反应单元节点和路径边;
19、所述将生物安全目标类别数据的作用机制关键信息片段加载至生物反应单元路径结构化模型得到生物安全目标类别数据反应单元路径,包括:
20、识别生物安全目标类别数据的作用机制关键信息中的实体并将其映射为生物反应单元路径结构化模型中的生物反应单元节点;
21、将生物安全目标类别数据的作用机制关键信息中的实体之间的作用关系映射为生物反应单元路径结构化模型中的路径边;
22、根据映射到模型中的生物反应单元节点和路径边,构建生物安全目标类别的反应单元路径。
23、在第一方面的一种可能的实施方式中,其特征在于,所述生物安全目标类别数据反应单元路径事件由彼此相邻的两个生物反应单元节点及其路径边构成;
24、所述生物安全风险标志事件是根据历史经验数据预设的生物安全风险事件列表;
25、所述从生物安全目标类别数据反应单元路径提取生物安全目标类别数据反应单元路径事件,对生物安全目标类别数据反应单元路径事件进行生物安全风险标志事件检测得到生物安全目标类别第一特征数据,包括:
26、获取生物安全目标类别数据反应单元路径,识别生物安全目标类别数据反应单元路径中的所有生物反应单元节点和路径边;
27、提取相邻生物反应单元节点和节点之间的路径边生成生物安全目标类别数据反应单元路径事件;
28、将生物安全目标类别数据反应单元路径事件与生物安全风险标志事件进行匹配得到生物安全目标类别数据反应单元路径事件对应的风险值;
29、将生物安全目标类别数据反应单元路径事件对应的风险值进行汇总得到生物安全目标类别第一特征数据。
30、在第一方面的一种可能的实施方式中,其特征在于,所述获取生物安全目标数据第二特征,将生物安全目标类别第一特征数据、第二特征数据输入安全风险诊断模型得到生物安全目标数据风险标签,基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制,包括:
31、获取生物安全目标数据第二特征;
32、将生物安全目标类别第一特征数据、生物安全目标类别第二特征数据中的数值特征进行归一化处理,将生物安全目标类别第一特征数据、生物安全目标类别第二特征数据中的分类特征进行独热编码处理得到生物安全目标类别特征集;
33、将生物安全目标类别特征集加载至安全风险诊断模型的输入层,通过安全风险诊断模型隐藏层向前传播后从安全风险诊断模型输出层得到生物安全目标数据风险标签;
34、基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制。
35、在第一方面的一种可能的实施方式中,所述获取生物安全目标数据第二特征是通过检索生物安全目标数据基本特征知识库进行数据获取,所述生物安全目标数据第二特征包括基因序列特征、表达特征、蛋白质功能特征、生态环境特征。
36、在第一方面的一种可能的实施方式中,其特征在于,所述安全风险诊断模型是基于神经网络算法搭建的对生物安全目标数据进行评估的模型,所述安全风险诊断模型框架包括:
37、将生物安全目标类别特征集作为输入层的输入;
38、第层隐藏层激活函数设置为;
39、第层为输出层,输出层设置个节点,分别输出第个维度的评估值,输出层第个节点的输出设置为;
40、通过交叉熵损失函数编译模型,并使用梯度下降法对和进行参数拟合;
41、其中:输入层生物安全目标类别特征集为,为第层的权重矩阵,为第层的偏置向量。
42、在第一方面的一种可能的实施方式中,所述生物安全目标数据风险标签设置的维度为环境生态安全性、人类健康安全性、动植物安全性、农业食品安全性;在基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制之前,所述生物安全数据库管理方法还包括:
43、将生物安全目标数据风险标签数据与设定阈值进行比较,当生物安全目标数据风险标签数据大于设定阈值时触发对应决策;
44、根据生物安全目标数据风险标签的各维度数值映射到平面各维度轴;
45、将相邻数据点连接起来形成一个闭合的多边形,生成生物安全目标数据安全特征雷达图;
46、通过使用图像处理库提取生物安全目标数据安全特征雷达图形状特征;
47、根据提取的生物安全目标数据安全特征雷达图形状特征匹配特定决策。
48、基于同一发明构思,本发明还提供了一种生物安全数据库管理系统,所述系统包括:
49、数据获取模块,用于获取生物安全目标数据,所述生物安全目标数据包括生物安全目标元件;
50、数据分类模块,用于将所述生物安全目标数据进行分类得到生物安全目标类别数据;
51、路径拟合模块,用于根据生物安全目标类别数据获取生物安全目标类别数据的作用机制关键信息片段,将生物安全目标类别数据的作用机制关键信息片段加载至生物反应单元路径结构化模型得到生物安全目标类别数据反应单元路径;
52、事件检测模块,用于从生物安全目标类别数据反应单元路径提取生物安全目标类别数据反应单元路径事件,对生物安全目标类别数据反应单元路径事件进行生物安全风险标志事件检测得到生物安全目标类别第一特征数据;
53、诊断决策模块,用于获取生物安全目标类别第二特征,将生物安全目标类别第一特征数据、第二特征数据输入安全风险诊断模型得到生物安全目标数据风险标签,基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制。
54、(3)有益效果
55、本发明的有益效果是:通过将生物安全目标数据进行分类获取生物安全目标类别数据的作用机制关键信息片段,将生物安全目标类别数据的作用机制关键信息片段加载至生物反应单元路径结构化模型提取路径事件,从作用机制层面对生物安全数据进行分析,增强生物安全性敏感度;通过安全风险诊断模型,结合生物安全目标类别第一特征数据和第二特征,能够自动生成多维度的生物安全目标数据风险标签,提高了安全性评估的效率和准确性;通过进一步提取风险标签维度形状特征并匹配特定决策,实现了生物安全数据个性化管理,提升了管理决策的针对性和有效性;从而从整体上实现更加高效精准的生物安全数据管理,提升生物安全性决策水平。
1.一种生物安全数据库管理方法,其特征在于,所述方法包括:
2.如权利要求1所述的生物安全数据库管理方法,其特征在于,所述将所述生物安全目标数据进行分类得到生物安全目标类别数据,包括:
3.如权利要求1所述的生物安全数据库管理方法,其特征在于,所述获取生物安全目标类别数据的作用机制文本信息,将生物安全目标类别数据的作用机制文本信息加载至生物反应单元路径结构化模型得到生物安全目标类别数据反应单元路径,包括:
4.如权利要求3所述的生物安全数据库管理方法,其特征在于,所述生物反应单元路径结构化模型是能够表示生物反应单元及其路径的数据结构,包含生物反应单元节点和路径边;
5.如权利要求1所述的生物安全数据库管理方法,其特征在于,所述生物安全目标类别数据反应单元路径事件由彼此相邻的两个生物反应单元节点及其路径边构成;
6.如权利要求1所述的生物安全数据库管理方法,其特征在于,所述获取生物安全目标数据第二特征,将生物安全目标类别第一特征数据、第二特征数据输入安全风险诊断模型得到生物安全目标数据风险标签,基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制,包括:
7.如权利要求6所述的生物安全数据库管理方法,其特征在于,所述获取生物安全目标数据第二特征是通过检索生物安全目标数据基本特征知识库进行数据获取,所述生物安全目标数据第二特征包括基因序列特征、表达特征、蛋白质功能特征、生态环境特征。
8.如权利要求6所述的生物安全数据库管理方法,其特征在于,所述安全风险诊断模型是基于神经网络算法搭建的对生物安全目标数据进行评估的模型,所述安全风险诊断模型框架包括:
9.如权利要求1所述的生物安全数据库管理方法,其特征在于,所述生物安全目标数据风险标签设置的维度为环境生态安全性、人类健康安全性、动植物安全性、农业食品安全性;在基于生物安全目标数据风险标签对生物安全目标数据匹配管理机制之前,所述生物安全数据库管理方法还包括:
10.一种生物安全数据库管理系统,其特征在于,所述系统包括: