本申请涉及机器学习,特别是涉及一种基于深度学习的微生物培养条件预测方法及系统。
背景技术:
1、微生物的培养条件对微生物的生长和产量有很大的影响。
2、常见的微生物培养方法有原位培养,通过将微生物直接接种在自然环境或模拟环境中进行培养,可以保持微生物的生态特征和遗传稳定性,适用于某些特殊环境下的微生物的培养,但其无法培养未知的或者丰度很低的微生物。
3、还有使用机器人技术来自动化地进行微生物接种、移液、检测等操作,通过大量实验,总结合适的培养条件,大大提高了培养效率,但其存在耗时长、准确率低的问题。
4、此外,也有通过基因测序,确定样品中微生物的分类,再根据分类树中相似微生物的培养条件,用来培养目标微生物;缺点是通过测序确定的不同微生物的数量有限,且相似性比对误差较大,无法深入挖掘大量未知的微生物。
技术实现思路
1、基于此,有必要提供一种基于深度学习的微生物培养条件预测方法及系统。
2、一方面,基于深度学习的微生物培养条件预测方法包括:
3、s1:获取已知的微生物的蛋白质序列及培养条件;
4、s2:以微生物的培养条件作为标签,对所述标签及其对应微生物的蛋白质序列进行编码预处理,得到二维向量;
5、s3:基于多个所述二维向量训练深度学习模型,得到预测模型;
6、s4:所述预测模型基于目标微生物的蛋白质序列,预测目标微生物的培养条件。
7、优选的,s1中,所述获取已知的微生物的蛋白质序列包括:
8、步骤1:将已知的微生物进行宏基因组测序,分箱后得到单一微生物的基因组草图;
9、步骤2:将所述基因组草图进行基因注释和冗余序列去除,得到单一微生物的所述蛋白质序列;
10、步骤3:重复步骤1-2,直至得到所有已知的微生物的所述蛋白质序列。
11、优选的,s2包括:
12、s2.1:采用机器学习算法对单物种的蛋白质序列进行筛选,得到第一特征蛋白质序列;
13、s2.2:对所述标签及其对应微生物的第一特征蛋白质序列按照libsvm格式进行编码,得到所述二维向量;
14、s2.3:重复s2.1-s2.2,直至遍历完所有已知的微生物,得到多个所述二维向量。
15、优选的,s3包括:
16、s3.1:将多个所述二维向量分为训练集和测试集;
17、s3.2:所述深度学习模型包括卷积层、池化层、扁平层以及全连接层;将所述训练集输入至所述深度学习模型,以二分类交叉熵为损失函数,并采用随机梯度下降法迭代,反向传播更新模型参数,得到训练好的预测模型;
18、s3.3:将所述测试集输入至训练好的预测模型,所述测试集用于测试训练好的预测模型预测的准确性。
19、优选的,在所述卷积层中,
20、从卷积层输入的尺寸到卷积层输出的尺寸的计算公式为:
21、;
22、其中,表示卷积层输出的尺寸;表示卷积层输入的尺寸; p表示填充的大小; f表示卷积核大小; s表示卷积步长;
23、进行卷积操作的参数量的计算公式为:
24、;
25、其中, weights表示参数量; c in表示前一层的通道数; c out表示当前层的通道数;
26、所述卷积层中的激活函数为relu函数;
27、在所述池化层中,采用平均池化,计算公式为:
28、;
29、其中,表示神经元激活值的平均值;表示区域上第 i个神经元激活值;
30、所述扁平层用于将神经元激活值组成的矩阵转换为节点;
31、所述全连接层用于采用sigmoid函数将所述节点转为二分类输出,所述二分类输出中的0表示不适用所述培养条件,1表示适用所述培养条件。
32、优选的,s4包括:
33、采用机器学习算法对目标微生物的蛋白质序列进行筛选,得到第二特征蛋白质序列;
34、将目标微生物的蛋白质序列用所述第二特征蛋白质序列替换,目标微生物的蛋白质序列中不属于第二特征蛋白质序列的位置用0取代,得到向量;
35、将所述向量中的0值项去除,并将所述向量扩张成二维,再归一化保存为灰度图;
36、将所述灰度图输入至所述预测模型,得到目标微生物的培养条件。
37、优选的,所述机器学习算法包括决策树、xgboost、svc、随机深林以及神经网络。
38、优选的,编码方式包括顺序编码、独热编码、语言编码。
39、优选的,所述培养条件包括温度、ph值、氧气浓度、营养成分。
40、另一方面,基于深度学习的微生物培养条件预测系统包括:
41、获取模块,用于已知的微生物的蛋白质序列及培养条件;
42、编码预处理模块,用于以微生物的培养条件作为标签,对所述标签及其对应微生物的蛋白质序列进行编码预处理,得到二维向量;
43、训练模块,用于基于多个所述二维向量训练深度学习模型,得到预测模型;
44、预测模块,用于所述预测模型基于目标微生物的蛋白质序列,预测目标微生物的培养条件。
45、有益效果:该方法能准确有效地预测不同微生物所需的培养条件,能够有效挖掘和培养未知的、低丰度的微生物。
1.一种基于深度学习的微生物培养条件预测方法,其特征在于,包括:
2.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,s1中,所述获取已知的微生物的蛋白质序列包括:
3.根据权利要求2所述的基于深度学习的微生物培养条件预测方法,其特征在于,s3包括:
4.根据权利要求3所述的基于深度学习的微生物培养条件预测方法,其特征在于,在所述卷积层中,
5.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,s4包括:
6.根据权利要求5所述的基于深度学习的微生物培养条件预测方法,其特征在于,所述机器学习算法包括决策树、xgboost、svc、随机深林以及神经网络。
7.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,编码方式包括顺序编码、独热编码、语言编码。
8.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,所述培养条件包括温度、ph值、氧气浓度、营养成分。
9.一种基于深度学习的微生物培养条件预测系统,其特征在于,包括: