基于小波变换与神经网络的故障检测方法、系统及介质与流程

专利检索2022-05-10 53

1.本发明涉及设备轴承故障检测技术领域，尤其是一种基于小波变换与神经网络的故障检测方法、系统及介质。

背景技术：

2.轴承故障在不同的阶段所表现出来的振动特性是不相同的，对于最早期的超声阶段，由于振动能量不高，特征不明显，而在故障后期轴承失效接近尾声时，轴承的故障特征频率和固有频率会被随机宽带高频“振动噪声”所淹没。因此，现有的滚动轴承故障振动处理方法更多集中在第二和第三阶段，即固有频率阶段和故障特征频率阶段。然而对于轴承的早期故障，由于故障振动信号微弱，尚缺少一种高效、准确的轴承故障检测方法。

技术实现要素：

3.本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
4.为此，本发明实施例的一个目的在于提供一种基于小波变换与神经网络的故障检测方法，该方法根据待测轴承的第一振动信号的频域信息选取合适的小波基函数，并根据该小波基函数对第一振动信号进行连续小波变换得到高精度的第一时频图，进而将该第一时频图输入到预先通过卷积神经网络训练得到的故障诊断模型中，得到待测轴承的故障类型识别结果。
5.本发明实施例的另一个目的在于提供一种基于小波变换与神经网络的故障检测系统。
6.为了达到上述技术目的，本发明实施例所采取的技术方案包括：
7.第一方面，本发明实施例提供了一种基于小波变换与神经网络的故障检测方法，包括以下步骤：
8.获取待测轴承的第一振动信号；
9.确定所述第一振动信号的第一频域信息，并根据所述第一频域信息选取对应的小波基函数；
10.根据所述小波基函数对所述第一振动信号进行连续小波变换，得到第一时频图；
11.将所述第一时频图输入到预先训练好的故障诊断模型，输出得到故障类型识别结果；
12.其中，所述故障诊断模型通过卷积神经网络训练得到。
13.进一步地，在本发明的一个实施例中，所述根据所述小波基函数对所述第一振动信号进行连续小波变换，得到第一时频图这一步骤，其具体为：
14.在不同的平移因子和尺度因子下，将所述小波基函数与所述第一振动信号做内积运算，得到多个小波函数，进而根据所述多个小波函数得到第一时频图。
15.进一步地，在本发明的一个实施例中，所述第一时频图为：
[0016][0017]
其中，cwtf(a,b)表示第一时频图，f(t)表示第一振动信号，a表示尺度因子，b表示平移因子，表示在平移因子b和尺度因子a下的小波基函数。
[0018]
进一步地，在本发明的一个实施例中，所述小波基函数为：
[0019][0020]
其中，ψ(t)表示小波基函数，c表示归一化常数。
[0021]
进一步地，在本发明的一个实施例中，所述基于小波变换与神经网络的故障检测方法还包括训练故障诊断模型的步骤，其具体包括：
[0022]
获取时频图数据集，所述时频图数据集包括设备轴承各个故障状态下的多个振动信号的第二时频图和对应的故障类型标签值；
[0023]
对所述时频图数据集进行去噪和抽稀处理，得到训练图片集；
[0024]
将所述训练图片集输入到预先构建的卷积神经网络进行训练，得到训练好的故障诊断模型。
[0025]
进一步地，在本发明的一个实施例中，所述将所述训练图片集输入到预先构建的卷积神经网络进行训练这一步骤，其具体包括：
[0026]
将所述训练图片集输入到所述卷积神经网络，得到故障类型预测结果；
[0027]
根据所述故障类型预测结果和所述故障类型标签值确定训练的损失值；
[0028]
根据所述损失值对所述卷积神经网络的参数进行更新。
[0029]
进一步地，在本发明的一个实施例中，所述卷积神经网络包括输入层、低隐层、全连接层以及输出层，所述低隐层由多个卷积层和多个池化层交替组成。
[0030]
第二方面，本发明实施例提出了一种基于小波变换与神经网络的故障检测系统，包括：
[0031]
振动信号获取模块，用于获取设备轴承的第一振动信号；
[0032]
小波基函数选取模块，用于确定所述第一振动信号的第一频域信息，并根据所述第一频域信息选取对应的小波基函数；
[0033]
第一时频图确定模块，用于根据所述小波基函数对所述第一振动信号进行连续小波变换，得到第一时频图；
[0034]
故障类型识别模块，用于将所述第一时频图输入到预先训练好的故障诊断模型，输出得到故障类型识别结果；
[0035]
其中，所述故障诊断模型通过卷积神经网络训练得到。
[0036]
第三方面，本发明实施例提供了一种基于小波变换与神经网络的故障检测装置，包括：
[0037]
至少一个处理器；
[0038]
至少一个存储器，用于存储至少一个程序；
[0039]
当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实
现上述的一种基于小波变换与神经网络的故障检测方法。
[0040]
第四方面，本发明实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于执行上述的一种基于小波变换和神经网络的故障检测方法。
[0041]
本发明的优点和有益效果将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到：
[0042]
本发明实施例根据待测轴承的第一振动信号的频域信息选取合适的小波基函数，并根据该小波基函数对第一振动信号进行连续小波变换得到高精度的第一时频图，进而将该第一时频图输入到预先通过卷积神经网络训练得到的故障诊断模型中，得到待测轴承的故障类型识别结果。本发明实施例通过选取合适的小波基函数可以在连续小波变换中保留微弱的故障振动信息，避免了噪声的干扰，提高了时频图的精度，进而提高了轴承故障检测的准确度；通过卷积神经网络训练故障诊断模型，提高了轴承故障检测的效率。
附图说明
[0043]
为了更清楚地说明本发明实施例中的技术方案，下面对本发明实施例中所需要使用的附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例，对于本领域的技术人员来说，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。
[0044]
图1为本发明实施例提供的一种基于小波变换与神经网络的故障检测方法的步骤流程图；
[0045]
图2为本发明实施例提供的一种基于小波变换与神经网络的故障检测系统的结构框图；
[0046]
图3为本发明实施例提供的一种基于小波变换与神经网络的故障检测装置的结构框图。
具体实施方式
[0047]
下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0048]
在本发明的描述中，多个的含义是两个或两个以上，如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外，除非另有定义，本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。
[0049]
参照图1，本发明实施例提供了一种基于小波变换与神经网络的故障检测方法，具体包括以下步骤：
[0050]
s101、获取待测轴承的第一振动信号；
[0051]
具体地，可通过振动传感器直接采集待测轴承的第一振动信号，也可以通过红外
位移传感器感应红外线光通量的变化从而得到待测轴承的第一振动信号。该第一振动信号是振幅基于时间的函数，在本发明实施例的叙述中，用f(t)表示第一振动信号。
[0052]
s102、确定第一振动信号的第一频域信息，并根据第一频域信息选取对应的小波基函数；
[0053]
具体地，可采用傅里叶变换实现好的时频转换从而得到第一振动信号的频域信息。傅里叶变换如下：
[0054][0055]
其中，f(t)表示第一振动信号，是关于t的周期函数；f(w)是关于t的频域函数，叫做f(t) 的象函数。
[0056]
由傅里叶变换的结果不难看出，变换后的信号并没有将时域与频域结合起来，即只能读出时域或频域的某一类信息。基于此，本发明实施例考虑用小波变换绘制信号的时频图，将原始振动信号所包含的信息尽可能地保存下来。
[0057]
小波是一种必须满足“容许”条件的函数，可视“容许”条件为限制条件，其限定了小波变换过程的可逆性，具体表示如下：
[0058][0059][0060]
其中，表示小波基函数，ψ(w)表示经傅里叶转换后的频域函数，表示容许条件，用于限制小波逆变换，其值必须有界。小波函数只有小的局部非零定义域，在窗口之外函数为0，并且小波本身是振荡的，完全不含有直流趋势成分，即满足：
[0061][0062]
本发明实施例中，通过傅里叶变换确定第一振动信号的频域信息后，根据该频域信息以及容许条件选取合适的小波基函数，便于后续进行连续小波变换。
[0063]
s103、根据小波基函数对第一振动信号进行连续小波变换，得到第一时频图；
[0064]
进一步作为可选的实施方式，根据小波基函数对第一振动信号进行连续小波变换，得到第一时频图这一步骤，其具体为：
[0065]
在不同的平移因子和尺度因子下，将小波基函数与第一振动信号做内积运算，得到多个小波函数，进而根据多个小波函数得到第一时频图。
[0066]
具体地，将小波基函数作位移b后，在不同的尺度a下，与原始的第一振动信号f(t)作内积，完成小波变换过程，可用下式表示：
[0067][0068]
式中，a表示尺度因子且a>0，作用是对小波基函数作伸缩变化；b表示平移因子，反映了小波基函数的位移变化，其值可正可负；本发明实施例中，设定a和b都是连续变量，故称为连续小波变换(cwt)。
[0069]
本发明实施例中连续小波变换的实现过程如下：
[0070]
a1、选择合适的小波基函数，固定一个尺度因子，将它与信号的初始段进行比较；
[0071]
a2、计算小波系数，小波系数反映了当前尺度下的小波与所对应的信号段的相似程度；
[0072]
a3、改变平移因子，使小波沿时间轴产生一定位移，重复上述步骤，完成一次变换；
[0073]
a4、增加尺度因子，重复上述三个步骤完成第二次分析；
[0074]
a5、循环执行上述步骤，直到满足分析要求为止。
[0075]
进一步作为可选的实施方式，第一时频图为：
[0076][0077]
其中，cwtf(a,b)表示第一时频图，f(t)表示第一振动信号，a表示尺度因子，b表示平移因子，表示在平移因子b和尺度因子a下的小波基函数。
[0078]
具体地，经过连续小波变换得到的第一时频图如下：
[0079][0080]
由上式可见，连续小波变换的结果可以表示为平移因子b和尺度因子a的函数。
[0081]
进一步作为可选的实施方式，小波基函数为：
[0082][0083]
其中，ψ(t)表示小波基函数，c表示归一化常数。
[0084]
具体地，在众多的小波基函数类型中，选择经典连续小波基morlet，也称为morl小波。
[0085]
morl小波是高斯包络下的单频率正弦函数，其表达式如下：
[0086][0087]
其中，c表示重构时的归一化常数，morl小波基没有尺度函数φ(t)，是非正交分解。
[0088]
计算机在实际处理时，将采集的信号数据f(t)的采样频率和总的数据量作为参量，调用 python中pywt.cwt函数，完成数据的连续小波变换，记录其输出值为cwtmatr，输出频率为 frequencies，最后在一维的时间序列中，按照3s的时间间隔分段读取信号，经小波变换后，以二维图格式保存其cwtmatr值到本地文件中，即第一时频图，并将文件按照故障类型命名后分别存储。
[0089]
经小波基函数处理得到时频图以图片形式保存到本地文件，一方面有利于人为查看，一方面利于在线编译。
[0090]
可以理解的是，本发明实施例中数据采集和信号处理可同时进行，极大程度加快了读取数据和分析数据的时间；采用的小波基保存了信号的时频信息，减少了信号传输过程的信号损失量，相当程度上保留了微弱的故障信息，使得后续的信号分析更加具有说服
力；信号的采集和处理基本实现自动化，不需要太多人为干预，减少了工作人员的劳动量，提高了工作的效率，降低了成本。
[0091]
s104、将第一时频图输入到预先训练好的故障诊断模型，输出得到故障类型识别结果；
[0092]
其中，故障诊断模型通过卷积神经网络训练得到。
[0093]
具体地，上述的连续小波变换过程完成了对原始振动信号f(t)的处理，并以图片格式的第一时频图保留了信号的时频信息，并完整保存在本地文件中，便于卷积神经网络的直接输入。在python平台中，图片读入后，可转换为矩阵形式，便于后续的计算、提取和识别。
[0094]
进一步作为可选的实施方式，卷积神经网络包括输入层、低隐层、全连接层以及输出层，低隐层由多个卷积层和多个池化层交替组成。
[0095]
本发明实施例中，采用卷积神经网络完成故障诊断模型的训练。卷积神经网络是一种多层的监督学习神经网络，隐含层的卷积层和池化层是实现卷积神经网络特征提取功能的核心模块。卷积神经网络的低隐层是由卷积层和池化层交替组成，高隐层是全连接层，对应着传统多层感知器的隐含层和逻辑回归分类器。
[0096]
基础卷积神经网络包括五个部分，输入层，卷积层，池化层，全连接层，输出层。每一层有多个特征图，每个特征图通过一种卷积滤波器提取输入的一种特征，每个特征图有多个神经元。输入层将每一个像素代表一个特征节点输入进来。卷积层由多个滤波器组成，对输入数据进行特征提取，组成卷积核的每一个元素都对应一个权重系数和一个偏差量。
[0097]
卷积层的参数是由一系列可以学习的滤波器构成的，每个滤波器在宽度和高度上都比较小，输入和数据保持一致。当滤波器沿着图像的宽和高滑动时，会生成一个二维的激活图。
[0098]
每个滤波器会有一整个滤波器的集合，会形成多个激活图。
[0099][0100][0101]
上式中，b为偏差量，z
l
和z
l 1
表示第l 1层的卷积输入和输出，l
l 1
为z
l 1
的尺寸，z(i,j) 对应特征图的像素，k为特征图的通道数，f对应卷积核大小，s0卷积步长，p填充层数。
[0102]
数据的分布绝大多数是非线性的，引入激励函数，是在神经网络中引入非线性关系，强化网络的学习能力。激励函数让网络的输入数据服从特定的分布：
[0103]
a.数据分布零均值化，即：通过分布计算得到的均值约等于0。非零均值化的分布可能导致梯度消失或训练抖动。
[0104]
b.数据分布呈正态分布。非正态分布可能导致算法过拟合。
[0105]
c.训练过程中，面对不同的数据尺度batch时，神经网络每一层的输入数据分布应自始至终保持一致，未能保持一致的现象叫做internal covaraite shift，会严重影响训练过程。
[0106]
卷积层中包含激励函数以协助表达复杂特征，其表示形式如下：
[0107][0108]
上式中，f(z)为表征激活函数，z
l
为l为第l层的输出，经激励函数处理后的输出值为a
l
。
[0109]
目前relu函数虽存在一些缺点，但使用relu也能取得很好的效果。相较于其他激活函数， relu有着最低的计算代价和最简单的代码实现。有能力生成零均值分布的激活函数，相较于其他激活函数更优。需要注意的是使用relu的神经网络训练和推理都会更慢一些，因为需要更复杂的指数运算得到函数激活值。
[0110]
池化层对卷积结果进行特征选择和信息过滤，可以有效的缩小参数矩阵的尺寸，从而减少最后连接层的中的参数数量，起到加快计算速度和防止过拟合的作用。池化层包含预设定的池化函数，其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。池化层选取池化区域与卷积核扫描特征图步骤相同，由池化大小、步长和填充控制。池化模型的一般表示形式为：
[0111][0112]
式中，步长s0、像素(i,j)的含义与卷积层相同，p是预定的参数。类比于向量范数，当p＝1 时，池化过程在池化区域内取均值，被称为平均池化(average pooling)；当p＝2时，池化过程在区域内取极大值，被称为最大池化(max pooling)。
[0113]
全连接层(fully connected layers，fc)在整个卷积神经网络中起到“分类器”的作用。卷积、池化和激活等操作将原始数据映射到隐藏层特征控件，全连接层起到将学到的“分布式特征”映射到样本标签的作用。网络的最后一层作为全连接层的输入。相关公式如下：
[0114]
z
j
＝w
j
x b
j
＝ω
j1
x1 ω
j2
x2
…
ω
jn
x
n
b
j
[0115]
将w
j
视为第j类下特征的权重，即每维特征的重要程度，通过对特征加权求和得到每个类别的分数，在经过softmax函数映射为概率。经过全连接层，获得了k个类别(
‑
∞, ∞)范围内的分数z
j
，为了得到属于每个类别的概率，先通过e
zj
将分数映射到(0, ∞)，然后再归一化到(0,1)。如下式：
[0116][0117]
把所有的e的z
j
次方计算出来并进行求和，再算出每个值占的比率，保证总和为1，就可以认为softmax得出的就是分类的概率。
[0118]
dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。使用dropout之后，传递过程发生改变，具体形式如下：
[0119]
1)随机(临时)删掉网络中的隐藏神经元，输入输出神经元保持不变；
[0120]
2)输入x通过修改后的网络进行前向传播，利用得到的损失结果，在修改后的网络中反向传播。一小批训练样本执行完这个过程后，在没有被删除的神经元上按照随机梯度下降法更新对应的参数(w，b)；
[0121]
3)然后继续重复这一过程：
[0122]
a.恢复被删掉的神经元(被删除的神经元保持原样，没有被删除的神经元已经有所更新)；
[0123]
b.从隐藏层神经元中随机选择一个子集临时删除掉(备份被删除神经元的参数)；
[0124]
c.对一小批训练样本，先前向传播，然后反向传播损失，并根据随机梯度下降法更新参数(没有被删除的那一部分参数得到更新，删除的神经元参数保持被删除前的结果)。
[0125]
4)不断重复这一过程，直到迭代次数结束。
[0126]
对应的计算公式如下：
[0127][0128]
y
～(l)
＝r
(l)
y
(l)
[0129][0130][0131]
上面公式中bernoulli函数是为了生成概率r向量，也就是随机生成一个0、1的向量。
[0132]
每个神经元的权重都乘以一个概率p，在“总体上”使得测试数据和训练数据是大致一样的。标准的模型没有dropout层，相同的训练数据去训练5个不同的神经网络，一般会得到5 个不同的结果，采用“5个结果取均值”或者“多数取胜的投票策略”去决定最终结果。不同的网络产生不同的过拟合，一些互为“反向”的拟合相互抵消就可以达到整体上减少过拟合。权值的更新不再依赖于有固定关系的隐含节点的共同作用，阻止了某些特征仅仅在其它特定特征下才有效果的情况。
[0133]
最大似然损失函数softmax_loss的计算包含2步：
[0134]
1)计算softmax归一化概率，公式如下：
[0135]
x
i
＝x
i
‑
max(x1,...,x
n
)
[0136][0137]
2)计算损失函数，公式如下：
[0138][0139]
其中，n为样本数，k为标签数目。
[0140]
adam算法利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。tensorflow 提供的tf.train.adamoptimizer可控制学习速度，经过偏置校正后，每一次迭
代学习率都有个确定范围，使得参数比较平稳。在tensorflow的默认初始背景下，步长α＝0.001，动力值大小β1＝0.9，β2＝0.999，epsilion为一个很小的数，用以避免除数为0，取ε＝10
‑8。在确定了参数α、β1、β2和随机目标函数f(w)之后，需要初始化参数向量、一阶矩向量、二阶矩向量和时间步。
[0141]
adam中将动量直接并入梯度一阶矩m0(指数加权)的估计。相比于缺少修正因子导致二阶矩估计可能在训练初期具有很高偏置的rmsprop，adam包括偏置修正，修正从原点初始化的一阶矩(动量项)和(非中心的)二阶矩估计。
[0142][0143]
其中，m
t
和v
t
分别为一阶动量项和二阶动量项。分别为各自的修正值。w
t
表示t 时刻即第t迭代模型的参数，表示第t次迭代时损失函数关于w的梯度大小。当参数w没有收敛时，循环迭代更新各个部分。即时间步t加1、更新目标函数在该时间步上对参数w所求的梯度、更新偏差的一阶矩估计和二阶原始矩估计、计算偏差修正的一阶矩估计和偏差修正的二阶矩估计，然后用以上计算出来的值更新模型的参数w
t
。
[0144]
将上述各层网络按照实际需要，选定各层函数，连接各层，完成卷积神经网络整体结构的搭建。在第一层网络中添加输入数据的维度，选定激活函数为relu函数；选定填充padding，保证数据维度的一致性；选定最大池化，步长为2。后面网络参照第一层网络设置适度更改。 dropout层设置参数为0.5，运算中屏蔽一半的神经元，但加快了网络模型的运算速度。全连接层选定激活函数为relu函数和softmax函数，适用于多分类问题。优化器选择adam，损失函数选择categorical_crossentropy，输出矩阵选择参量accuracy。至此，初始的卷积神经网络模型搭建完成。
[0145]
以上对本发明实施例所采用的卷积神经网络作了介绍说明。本发明实施例将经过小波变换后的第二时频图按照故障类型构造数据训练集(用于训练模型，确定参数值)和测试集(预测模型准确率)，并把设定的文件名称作为标签值(用于表达故障类别)，最后把数据导入上述的卷积神经网络模型中，完成故障诊断模块的训练。在后续的工作过程中，对于实时采集的振动信号，直接投入到已训练好的故障诊断模型中，进行相应的故障判断。
[0146]
可以认识到，卷积神经网络模型直接读取的是本地文件夹，减少了信息处理过程，大大提高了计算机的运算速度，降低了计算机识别的时间；另一方面，在经验允许的情况下，对于特别明显的图片信号，工作人员能根据肉眼查看的方式，直接判断诊断结果；卷积层所使用的参数量可自行调节，对于复杂模型适度增加层数，对于简单模型，适度减少层数，合理控制总的参数量，能够降低网络识别的时间成本；在大数据的支撑下，卷积神经网络对于故障信号识别率可达95％以上，对于工业生产中设备的正常运行具有相当的保障性；可迁移性，某一设备中卷积神经网络识别出的故障信号，可用于其他设备中进行识别，
可谓是一举多得，极大降低了工作者的劳动时间；网络对故障信号进行自动化识别，可实时监控设备运行状态，降低了设备故障的风险，对于维护和监测人员的要求更低，基本实现设备故障的可视化。
[0147]
进一步作为可选的实施方式，基于小波变换与神经网络的故障检测方法还包括训练故障诊断模型的步骤，其具体包括：
[0148]
b1、获取时频图数据集，时频图数据集包括设备轴承各个故障状态下的多个振动信号的第二时频图和对应的故障类型标签值；
[0149]
b2、对时频图数据集进行去噪和抽稀处理，得到训练图片集；
[0150]
b3、将训练图片集输入到预先构建的卷积神经网络进行训练，得到训练好的故障诊断模型。
[0151]
进一步作为可选的实施方式，将训练图片集输入到预先构建的卷积神经网络进行训练这一步骤，其具体包括：
[0152]
c1、将训练图片集输入到卷积神经网络，得到故障类型预测结果；
[0153]
c2、根据故障类型预测结果和故障类型标签值确定训练的损失值；
[0154]
c3、根据损失值对卷积神经网络的参数进行更新。
[0155]
具体地，将训练数据集中的数据输入到初始化后的卷积神经网络模型后，可以得到模型输出的识别结果，即故障类型预测结果，可以根据故障类型预测结果和前述的标签值来评估识别模型预测的准确性，从而对模型的参数进行更新。对于故障诊断模型来说，模型预测结果的准确性可以通过损失函数(loss function)来衡量，损失函数是定义在单个训练数据上的，用于衡量一个训练数据的预测误差，具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时，一个训练数据集有很多训练数据，因此一般采用代价函数(cost function)来衡量训练数据集的整体误差，代价函数是定义在整个训练数据集上的，用于计算所有训练数据的预测误差的平均值，能够更好地衡量出模型的预测效果。对于一般的机器学习模型来说，基于前述的代价函数，再加上衡量模型复杂度的正则项即可作为训练的目标函数，基于该目标函数便能求出整个训练数据集的损失值。常用的损失函数种类有很多，例如0
‑
1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数，在此不再一一阐述。本发明实施例中，可以从中任选一种损失函数来确定训练的损失值。基于训练的损失值，采用反向传播算法对模型的参数进行更新，迭代几轮即可得到训练好的故障诊断模型。具体地迭代轮数可以预先设定，或者在测试集达到精度要求时认为训练完成。
[0156]
以上对本发明的方法步骤进行了说明，本发明实施例通过选取合适的小波基函数可以在连续小波变换中保留微弱的故障振动信息，避免了噪声的干扰，提高了时频图的精度，进而提高了轴承故障检测的准确度；通过卷积神经网络训练故障诊断模型，提高了轴承故障检测的效率。
[0157]
参照图2，本发明实施例提供了一种基于小波变换与神经网络的故障检测系统，包括：
[0158]
振动信号获取模块，用于获取设备轴承的第一振动信号；
[0159]
小波基函数选取模块，用于确定第一振动信号的第一频域信息，并根据第一频域信息选取对应的小波基函数；
[0160]
第一时频图确定模块，用于根据小波基函数对第一振动信号进行连续小波变换，得到第一时频图；
[0161]
故障类型识别模块，用于将第一时频图输入到预先训练好的故障诊断模型，输出得到故障类型识别结果；
[0162]
其中，故障诊断模型通过卷积神经网络训练得到。
[0163]
上述方法实施例中的内容均适用于本系统实施例中，本系统实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0164]
参照图3，本发明实施例提供了一种基于小波变换与神经网络的故障检测装置，包括：
[0165]
至少一个处理器；
[0166]
至少一个存储器，用于存储至少一个程序；
[0167]
当上述至少一个程序被上述至少一个处理器执行时，使得上述至少一个处理器实现上述的一种基于小波变换与神经网络的故障检测方法。
[0168]
上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0169]
本发明实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，该处理器可执行的程序在由处理器执行时用于执行上述一种基于小波变换与神经网络的故障检测方法。
[0170]
本发明实施例的一种计算机可读存储介质，可执行本发明方法实施例所提供的一种基于小波变换和神经网络的故障检测方法，可执行方法实施例的任意组合实施步骤，具备该方法相应的功能和有益效果。
[0171]
本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行图1所示的方法。
[0172]
在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0173]
此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无
需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
[0174]
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram， random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0175]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0176]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器 (cdrom)。另外，计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序，然后将其存储在计算机存储器中。
[0177]
应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0178]
在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0179]
尽管已经示出和描述了本发明的实施方式，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。
[0180]
以上是对本发明的较佳实施进行了具体说明，但本发明并不限于上述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这
些等同的变形或替换均包含在本技术权利要求所限定的范围内。

转载请注明原文地址:https://win.8miu.com/read-50068.html

专利

最新回复(0)