一种基于深度学习的微生物培养条件预测方法及系统与流程

专利检索2025-02-10  39


本申请涉及机器学习,特别是涉及一种基于深度学习的微生物培养条件预测方法及系统。


背景技术:

1、微生物的培养条件对微生物的生长和产量有很大的影响。

2、常见的微生物培养方法有原位培养,通过将微生物直接接种在自然环境或模拟环境中进行培养,可以保持微生物的生态特征和遗传稳定性,适用于某些特殊环境下的微生物的培养,但其无法培养未知的或者丰度很低的微生物。

3、还有使用机器人技术来自动化地进行微生物接种、移液、检测等操作,通过大量实验,总结合适的培养条件,大大提高了培养效率,但其存在耗时长、准确率低的问题。

4、此外,也有通过基因测序,确定样品中微生物的分类,再根据分类树中相似微生物的培养条件,用来培养目标微生物;缺点是通过测序确定的不同微生物的数量有限,且相似性比对误差较大,无法深入挖掘大量未知的微生物。


技术实现思路

1、基于此,有必要提供一种基于深度学习的微生物培养条件预测方法及系统。

2、一方面,基于深度学习的微生物培养条件预测方法包括:

3、s1:获取已知的微生物的蛋白质序列及培养条件;

4、s2:以微生物的培养条件作为标签,对所述标签及其对应微生物的蛋白质序列进行编码预处理,得到二维向量;

5、s3:基于多个所述二维向量训练深度学习模型,得到预测模型;

6、s4:所述预测模型基于目标微生物的蛋白质序列,预测目标微生物的培养条件。

7、优选的,s1中,所述获取已知的微生物的蛋白质序列包括:

8、步骤1:将已知的微生物进行宏基因组测序,分箱后得到单一微生物的基因组草图;

9、步骤2:将所述基因组草图进行基因注释和冗余序列去除,得到单一微生物的所述蛋白质序列;

10、步骤3:重复步骤1-2,直至得到所有已知的微生物的所述蛋白质序列。

11、优选的,s2包括:

12、s2.1:采用机器学习算法对单物种的蛋白质序列进行筛选,得到第一特征蛋白质序列;

13、s2.2:对所述标签及其对应微生物的第一特征蛋白质序列按照libsvm格式进行编码,得到所述二维向量;

14、s2.3:重复s2.1-s2.2,直至遍历完所有已知的微生物,得到多个所述二维向量。

15、优选的,s3包括:

16、s3.1:将多个所述二维向量分为训练集和测试集;

17、s3.2:所述深度学习模型包括卷积层、池化层、扁平层以及全连接层;将所述训练集输入至所述深度学习模型,以二分类交叉熵为损失函数,并采用随机梯度下降法迭代,反向传播更新模型参数,得到训练好的预测模型;

18、s3.3:将所述测试集输入至训练好的预测模型,所述测试集用于测试训练好的预测模型预测的准确性。

19、优选的,在所述卷积层中,

20、从卷积层输入的尺寸到卷积层输出的尺寸的计算公式为:

21、;

22、其中,表示卷积层输出的尺寸;表示卷积层输入的尺寸; p表示填充的大小; f表示卷积核大小; s表示卷积步长;

23、进行卷积操作的参数量的计算公式为:

24、;

25、其中, weights表示参数量; c in表示前一层的通道数; c out表示当前层的通道数;

26、所述卷积层中的激活函数为relu函数;

27、在所述池化层中,采用平均池化,计算公式为:

28、;

29、其中,表示神经元激活值的平均值;表示区域上第 i个神经元激活值;

30、所述扁平层用于将神经元激活值组成的矩阵转换为节点;

31、所述全连接层用于采用sigmoid函数将所述节点转为二分类输出,所述二分类输出中的0表示不适用所述培养条件,1表示适用所述培养条件。

32、优选的,s4包括:

33、采用机器学习算法对目标微生物的蛋白质序列进行筛选,得到第二特征蛋白质序列;

34、将目标微生物的蛋白质序列用所述第二特征蛋白质序列替换,目标微生物的蛋白质序列中不属于第二特征蛋白质序列的位置用0取代,得到向量;

35、将所述向量中的0值项去除,并将所述向量扩张成二维,再归一化保存为灰度图;

36、将所述灰度图输入至所述预测模型,得到目标微生物的培养条件。

37、优选的,所述机器学习算法包括决策树、xgboost、svc、随机深林以及神经网络。

38、优选的,编码方式包括顺序编码、独热编码、语言编码。

39、优选的,所述培养条件包括温度、ph值、氧气浓度、营养成分。

40、另一方面,基于深度学习的微生物培养条件预测系统包括:

41、获取模块,用于已知的微生物的蛋白质序列及培养条件;

42、编码预处理模块,用于以微生物的培养条件作为标签,对所述标签及其对应微生物的蛋白质序列进行编码预处理,得到二维向量;

43、训练模块,用于基于多个所述二维向量训练深度学习模型,得到预测模型;

44、预测模块,用于所述预测模型基于目标微生物的蛋白质序列,预测目标微生物的培养条件。

45、有益效果:该方法能准确有效地预测不同微生物所需的培养条件,能够有效挖掘和培养未知的、低丰度的微生物。



技术特征:

1.一种基于深度学习的微生物培养条件预测方法,其特征在于,包括:

2.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,s1中,所述获取已知的微生物的蛋白质序列包括:

3.根据权利要求2所述的基于深度学习的微生物培养条件预测方法,其特征在于,s3包括:

4.根据权利要求3所述的基于深度学习的微生物培养条件预测方法,其特征在于,在所述卷积层中,

5.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,s4包括:

6.根据权利要求5所述的基于深度学习的微生物培养条件预测方法,其特征在于,所述机器学习算法包括决策树、xgboost、svc、随机深林以及神经网络。

7.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,编码方式包括顺序编码、独热编码、语言编码。

8.根据权利要求1所述的基于深度学习的微生物培养条件预测方法,其特征在于,所述培养条件包括温度、ph值、氧气浓度、营养成分。

9.一种基于深度学习的微生物培养条件预测系统,其特征在于,包括:


技术总结
本申请涉及一种基于深度学习的微生物培养条件预测方法及系统,方法包括:获取已知的微生物的蛋白质序列及培养条件;以微生物的培养条件作为标签,对所述标签及其对应微生物的蛋白质序列进行编码预处理,得到二维向量;基于多个所述二维向量训练深度学习模型,得到预测模型;所述预测模型基于目标微生物的蛋白质序列,预测目标微生物的培养条件。系统包括:获取模块、编码预处理模块、训练模块、预测模块。该方法能准确有效地预测不同微生物所需的培养条件,能够有效挖掘和培养未知的、低丰度的微生物。

技术研发人员:王文昭,邱艳飞
受保护的技术使用者:福瑞莱环保科技(深圳)股份有限公司
技术研发日:
技术公布日:2024/5/29
转载请注明原文地址:https://win.8miu.com/read-1149853.html

最新回复(0)