本发明涉及机械设备故障预测,尤其是涉及一种基于注意力机制的lstm机器剩余使用寿命预测方法。
背景技术:
1、机械设备的安全性和可靠性是保证现代工业快速发展的重要因素。为了机械设备的顺利运行,剩余使用寿命(rul)预测至关重要。目前,rul预测的方法主要包括基于物理模型的预测方法和基于数据驱动的方法。其中基于数据驱动的方法由基于统计学模型和包括传统机器学习和深度学习的基于人工智能的方法组成。对于基于物理模型、统计学模型和传统机器学习的方法来说,虽然已经取得一些不错的预测效果,但是需要广泛的失效机制领域知识或者随机过程的先验知识来建立设备的物理退化模型和统计学模型,传统机器学习也需要人工耗费大量的时间、精力进行特征工程。同时还面临对不同研究目标的泛化能力差,往往需要重复建模的问题。而深度学习作为具有很强的非线性函数拟合能力的数据驱动算法,能够较好的捕捉时间序列数据中隐含的函数关系,因此基于深度学习的算法近年来成为rul预测研究的热点。
2、基于深度学习的预测方法,相对于cnn用卷积核卷积提取信息的操作,使用rnn进行机械剩余寿命预测时更能把握数据和时序的重要关系,捕捉提取出时间序列中的隐藏的长期相关信息。但是rnn本身梯度消失和梯度爆炸问题的存在又给预测带来了一定的困难。长短期记忆网络(lstm)的门控机制很好的解决了这个问题。同时,通过长短期记忆网络的遗忘门、输入门、输出门的控制使得其学习长期依赖关系时效果变得更好了。但是在学习特征关系的过程中,对于不同特征的提取程度和不同时序的相关关系不能进行完成的把握,这使得网络不仅忽视了部分退化信息还对冗余信息进行了相同程度的提取学习。所以如何保证能学习重要特征并且能够清晰的将序列之间的相关关系进行突出并输入给网络十分重要。
技术实现思路
1、本发明的目的是提供一种基于注意力机制的lstm机器剩余使用寿命预测方法,直接从采集信号中提取特征,捕捉数据中隐含关系,把深层的退化特征能映射成具体的设备剩余使用寿命值,从而实现设备剩余使用寿命预测。
2、为实现上述目的,本发明提供了一种基于注意力机制的lstm机器剩余使用寿命预测方法,包括以下步骤:
3、s1、利用传感器采集设备从开始运行到最后失效的全寿命数据作为训练集,采集设备实时运行数据作为测试集,然后对训练集数据和测试集数据进行预处理;
4、s2、构建端到端的深度学习剩余寿命预测模型;
5、s3、将步骤s1中的训练集数据输入到深度学习预测模型中对深度学习预测模型进行训练,通过评价函数来验证有效性,得到训练好的深度学习预测模型;
6、s4、将步骤s1中由设备实时运行数据测试集数据输入到步骤s4中训练好的深度学习预测模型中,得到实时运行设备的剩余使用寿命,通过评价函数确定模型效果。
7、优选的,步骤s1中,数据预处理包括:剔除数据恒定传感器数据,数据归一化处理,滑动窗口处理划分数据矩阵,建立寿命标签和标签归一化,得到处理后的训练集和测试集。
8、优选的,步骤s2中,通过使用压缩提取机制给特征维度进行加权的的空间注意力模块部分、使用长短期记忆神经网络对数据隐藏信息进行提取的神经网络部分、使用排列筛选机制给时间维度进行加权的时间注意力模块部分和将深层退化特征映射成具体寿命值的剩余使用寿命预测部分构建端到端的深度学习寿命预测模型。
9、优选的,步骤s2中,使用压缩提取机制给特征维度进行加权的的空间注意力模块部分表达式如下:
10、;
11、;
12、==;
13、其中,表示时间窗口;表示经过预处理过后的多变量特征时间序列数据的其中一个数据,其中t表示时间窗口的某一时间点;()代表全局平均池化操作;表示经过预处理过后的多变量特征时间序列数据;表示经过平均池化操作提取后的时间序列数据;代表sigmoid运算;conv1( )表示卷积核为的一维卷积运算;conv2( )表示卷积核为的一维卷积运算;conv2( )用于压缩特征通道是特征相互作用,conv1( )用于恢复特征通道;和表示经过提取出的注意力权重数据;,表示实数集维度为c,c表示数据特征数;表示经过特征注意力加权后的时间序列数据;代表第c个传感器的所有时间序列的数据,表示实数集维度为t;则代表在t时刻,所有传感器记录下的数据;表示实数集维度为t乘c,符号代表数据的逐个相乘。
14、优选的,步骤s2中,使用长短期记忆神经网络对数据隐藏信息进行提取的神经网络部分表达式如下:
15、;
16、;
17、;
18、;
19、;
20、;
21、;
22、其中,表示长短期记忆网络中输入门的输入数据;表示长短期记忆神经网络中的输入门数据;表示长短期记忆神经网络中的遗忘门数据;表示长短期记忆网络的输出门数据;表示长短期记忆网络的长记忆数据;表示长短期记忆网络的短记忆数据;表示网络的输出结果;、、、指的是权重矩阵;、、、代表偏差;表示记忆单元;表示输入数据;表示tanh激活函数;表示sigmoid激活函数,表示乘法操作;lstm()表示lstm网络运算处理;则表示lstm网络中的各个参数。
23、优选的,步骤s2中,使用排列筛选机制给时间维度进行加权的时间注意力模块计算表达式如下:
24、;
25、;
26、;
27、;
28、;
29、=con();
30、其中,指对做在时间上softmax数学运算;指将同时间的数据求和;为对做权重提取后的时间序列数据;是中的最后一组数据;函数指的是将数据从大到小排列;函数则是指取数据最大值;k代表取最大值的个数,即后续保留下的时间行的行数;为经过和操作后的序列数据;通过和的数值定义出排列选择的函数;指的是对长短期记忆网络的结果进行函数运行的数据结果,为中某个数据;表示得到后的时间维数据权重,指权重中的最后一组数据权重;表示对数据进行时间维权重赋予后的结果数据;con()表示连接操作,沿着时间行的方向将两个向量拼接形成一个完整的特征集;是中的最后一行数据;为数据拼接后的最终输出;,,,分别表示实数集维度分别为t×1,k×1,k×c,(k+1)×c。
31、优选的,步骤s2中,将深层退化特征映射成具体寿命值的剩余使用寿命预测部分表达式如下:
32、;
33、其中,表示全连接操作;表示网络rul的最终预测值;、、分别代表连接层的参数矩阵;代表relu激活函数。
34、优选的,步骤s3、s4中,评价函数如下:
35、;
36、;
37、,;
38、其中,n则表示测试样本总数;为样本的实际rul值,n=1,2,…,n;是第n个样本中的预测值与真实值之差。
39、因此,本发明采用上述一种基于注意力机制的lstm机器剩余使用寿命预测方法,其技术效果如下:
40、(1)提出了一种基于注意力机制的lstm机器剩余使用寿命预测方法,这是一种不需要先验知识的端到端的预测模型,可以直接利用预处理好的原始传感器数据,不需要额外的特征工程。
41、(2)本发明是一种端到端的预测模型,结合空间注意力模块、神经网络部分、时间注意力模块部分和剩余使用寿命预测部分可以直接利用预处理好的原始传感器数据,自适应的对数据进行加权处理把深层退化特征映射成具体的设备剩余使用寿命值。
42、(3)本发明提出了基于注意力机制的压缩提取机制和排列筛选机制,自适应的完成特征的加权筛选,突出退化敏感特征,抑制冗余特征。无论是对特征还是时序都进行了有效加权,助于网络提取隐藏信息。解决了预测时重要特征不突出,时间序列间相关关系难提取的问题。
43、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
1.一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s1中,数据预处理包括:剔除数据恒定传感器数据,数据归一化处理,滑动窗口处理划分数据矩阵,建立寿命标签和标签归一化,得到处理后的训练集和测试集。
3.根据权利要求1所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s2中,通过使用压缩提取机制给特征维度进行加权的的空间注意力模块部分、使用长短期记忆神经网络对数据隐藏信息进行提取的神经网络部分、使用排列筛选机制给时间维度进行加权的时间注意力模块部分和将深层退化特征映射成具体寿命值的剩余使用寿命预测部分构建端到端的深度学习寿命预测模型。
4.根据权利要求3所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s2中,使用压缩提取机制给特征维度进行加权的的空间注意力模块部分表达式如下:
5.根据权利要求4所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s2中,使用长短期记忆神经网络对数据隐藏信息进行提取的神经网络部分表达式如下:
6.根据权利要求5所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s2中,使用排列筛选机制给时间维度进行加权的时间注意力模块计算表达式如下:
7.根据权利要求6所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s2中,将深层退化特征映射成具体寿命值的剩余使用寿命预测部分表达式如下:
8.根据权利要求7所述的一种基于注意力机制的lstm机器剩余使用寿命预测方法,其特征在于,步骤s3、s4中,评价函数如下:
