本发明属于工业自动化设备健康状态监测,尤其涉及一种基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法及系统,是保障工业设备安全运行的支撑手段。
背景技术:
1、作为工业自动化设备的核心部件,滚动轴承对设备安全运行和性能发挥起着重要作用。为监测轴承的健康状态,判断运行中的轴承是否出现故障以及准确分类故障类型显得尤为关键。由于轴承的易损性,其健康状态受时间和工况环境的影响而不断演变,导致监测数据与轴承状态之间的关系呈现出高复杂性。因此,基于传感器信号,如振动信号和热成像等,准确判定轴承故障情况以及识别故障类型成为一个具有挑战性的实际需求问题。
2、在轴承故障类型分类方面,通常利用滚动轴承的振动信号来获取其内部状态信息。这种方法在轴承状态检测中被广泛采用。随着互联网、物联网和工业大数据的快速发展,故障诊断技术从专家导向转变为数据驱动,推向了新的高潮。在这一趋势下,深度学习模型掀起了一波智能诊断方法的热潮,并取得了引人注目的成就。这种技术打破了基于模型或信号分析的诊断方法的常规,将诊断问题视为端到端的健康模式识别问题。目前思路是运用深度学习技术进行故障诊断。这种方法属于监督学习,即利用带有标签的数据集对模型进行训练,然后将待识别的振动信号输入训练好的模型,以获得准确的故障类型分类结果。
3、尽管具有吸引人的性能,但这些模型都基于数据的独立同分布假设。然而在实际应用中,不同数据往往存在着跨机组、工况变化以及传感器位置差异等多种因素。这些因素导致了源域数据与目标域数据呈现出不同的分布特征。由于工作状态的变化和监测环境的不确定性,源域数据集和目标域数据集之间的数据特征或分布总是存在不可避免的差异。因此,由于未满足上述先决条件,模型性能将急剧下降。换言之,将训练好的模型直接应用于具有领域转移的新任务是困难的。鉴此,跨域故障诊断技术对于解决实际生产环境中的轴承健康监测问题具有重要意义。
4、目前,出现了基于无监督领域自适应(uda)的诊断技术。这些方法旨在减少领域偏差,将标记的源域数据集和未标记的目标域数据集在一个共同的表示空间中对齐,使得在源域上训练的模型可以推广到目标域。尽管当前的uda方法取得了成功,但它们往往默认了一个前提,即源域数据集在训练过程中始终可用。这是因为源域数据集在保留有价值的故障识别相关语义知识和减少迭代适应过程中的分布差异方面的重要性。然而,在众多的现实情境中,这样的前提条件往往并不适用。原因在于,源域数据集并非总是能够轻易获取,这通常是由于涉及到隐私保护或知识产权等方面的限制。例如,监测数据中蕴含了大量关于设备性能和潜在问题的敏感信息,这些信息对于企业而言,既具有关键的战略价值,又涉及深度的隐私保护需求。正是因为这种双重性质,它们对于提升产品的市场竞争力和保护企业的核心竞争力具有不可忽视的作用。因此,如何在确保数据安全和隐私的前提下,有效地利用这些监测数据,成为了企业需要认真考虑和解决的问题。为了解决这个问题,组织更愿意提供经过训练的模型,而不是源域数据集。在这种无源域情形下进行跨域轴承故障诊断面临着更大的挑战。这种情形下,模型进行领域自适应迁移时是完全脱离源域数据集的,这意味着模型只能进行无监督训练。实践证明,这个挑战已经无法通过对无监督领域自适应进行简单扩展以解决。基于模型结构以及学习策略,一种深度学习网络设计端到端的故障诊断方法有望提供一个有效的解决方案。
5、通过上述分析,现有技术存在的问题及缺陷为:
6、现有的滚动轴承故障诊断方法大都假设源域数据集总是可访问的,但这个假设在实际应用场景下很难成立,脱离源域进行无监督训练会使得传统的诊断模型无法进行自迁移训练。
技术实现思路
1、针对现有技术存在的问题,本发明提供了一种基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法及系统。
2、本发明是这样实现的,一种基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类系统,该系统包括:
3、a. 数据增强模块,用于对初始源域数据集和目标域数据集进行数据增强,生成新增的源域样本和目标域样本,以及相应的样本标签和伪标签;
4、b. 一维resnet18深度卷积神经网络,用于接收增强后的源域数据集,并利用标签平滑交叉熵loss进行监督化学习训练,生成基于源域的轴承故障类型分类预训练模型;
5、c. 伪标签生成模块,用于将目标域样本输入预训练模型,获取对应特征和softmax预测输出,并据此生成目标域样本的伪标签;
6、d. 无监督学习训练,用于利用目标域样本的输出与伪标签之间的标签平滑交叉熵loss,以及样本特征的近邻吸引与同批分散loss进行无监督学习训练,使预训练模型能够自适应地迁移到目标域数据集;
7、e. 分类器模块,用于接收经过无监督学习训练后的目标域样本,输出准确的目标域样本预测标签。
8、进一步,还设置有轴承故障类型分类系统,该系统适应于无源领域自适应学习,包括:
9、数据处理单元,用于接收振动信号数据集,并对其进行数据增强和伪标签生成;
10、深度学习模型单元,包含一维resnet18深度卷积神经网络,用于对源域数据集进行监督化学习训练,生成轴承故障类型分类预训练模型,并对目标域数据集进行无监督学习训练,实现模型的自适应迁移;
11、损失计算单元,用于计算源域数据集和目标域数据集的标签平滑交叉熵loss,以及目标域样本特征的近邻吸引与同批分散loss,以优化深度学习模型的训练过程;
12、预测输出单元,用于根据训练后的深度学习模型,对目标域样本进行分类,并输出准确的预测标签。
13、本发明还提供了一种基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法包括:将源域样本通过数据增强模块进行数据增强获得新增源域样本;源域与新增源域样本输入卷积神经网络进行监督训练获得基于源域的轴承故障类型分类预训练模型;将目标域样本通过故障分类模型与伪标签生成模块获得伪标签;之后利用伪标签将目标域样本通过数据增强模块进行数据增强获得新增目标域样本;目标域与新增目标域样本输入卷积神经网络,使用进行无监督训练,并最后输出预测标签。
14、进一步,基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法包括以下步骤:
15、步骤s1:取得振动信号数据集作为初始源域数据集,初始源域数据集包含振动信号数据的所有样本以及样本标签;将初始源域数据集的样本以及样本标签通过数据增强模块进行数据增强,获得新增的源域样本以及样本标签;新增的部分与初始源域数据集结合成新源域数据集。
16、步骤s2:将步骤s1新源域数据集的所有样本输入一维resnet18深度卷积神经网络,利用标签平滑交叉熵loss进行监督化学习训练,获得基于源域的轴承故障类型分类预训练模型,该模型学习到了源域内的轴承故障分类语义信息。
17、步骤s3:取得振动信号数据集作为初始目标域数据集,源域和目标域中的故障类型集合相同;将目标域样本输入s2步骤中的故障分类模型,获得目标域样本的对应特征以及softmax预测输出;再将特征和预测输出输入伪标签生成模块,获得目标域样本的伪标签;将目标域样本以及伪标签通过数据增强模块进行数据增强,获得新增的目标域样本以及伪标签;新增的部分与初始目标域数据集结合成新目标域数据集。
18、步骤s4:将步骤s3新目标域数据集的所有样本输入s2步骤中的故障分类模型,利用输出与伪标签之间的标签平滑交叉熵loss进行无监督学习训练;与此同时,模型使用新引入的样本特征的近邻吸引与同批分散loss进行无监督学习训练;使得故障分类模型能够从在脱离源域数据集的情况下,自适应的迁移到目标域数据集。最后目标域样本通过故障分类模型的分类器能够输出准确的目标域样本的预测标签。
19、进一步,在所述s1步骤中,取得振动信号数据集作为初始源域数据集。将类别的数量记为k,初始源域数据集记为,其中表示初始源域样本中的第个振动信号,而表示对应的故障类型标签,则是初始源域样本的数量。对于数据增强模块,它需要输入随机两个故障样本和,以及对应的标签和 ,而数据增强模块本身会计算样本的长度以及随机生成的窗口长度win。在每次训练时,数据增强模块都会以概率执行数据增强操作,从故障样本和故障样本以随机的相同位置截取窗口,然后将窗口的内容覆盖掉中窗口的内容,得到混合之后的新样本,而新标签计算方式如下所示:
20、(1)
21、概率通常设定为0.5。将初始源域数据集经过数据增强模块得到的源域数据集记为。将数据集与数据集整合,得到新源域数据集,公式如下:
22、(2)
23、其中表示新源域样本中的第个振动信号,为振动信号对应的故障类型标签,则是新源域样本的数量。
24、进一步,在所述s2步骤中,其一维resnet18深度卷积神经网络包含特征提取器以及分类器,将新源域样本输入特征提取器提取的样本特征命为,然后将样本特征输入分类器f,得到源域的样本预测输出。对一维resnet18深度卷积神经网络使用标签平滑交叉熵损失函数进行有监督学习训练,获得基于源域训练的故障分类模型。标签平滑交叉熵损失函数包括对样本标签进行标签平滑操作,目标是通过向正确类别的标签添加噪声,使其不再是完全的0和1,而是接近0和1的值。通过标签平滑交叉熵损失函数的计算,提高故障分类模型对源域的预测标签的准确率。对于源域训练的故障分类模型,其标签平滑交叉熵损失函数结果求平均,得到,计算方式如下:
25、(3)
26、上述总损失函数公式(3)通过随机梯度下降(sgd)法的不断迭代训练,更新网络的权重参数。这个过程不仅可以获得源域训练后的故障分类模型,还可以提高故障分类模型的特征提取能力以及鲁棒性。
27、进一步,在所述s3步骤中,取得振动信号数据集作为初始目标域数据集,记为,其中表示第 个目标域样本的振动信号,而则是目标域样本的数量。目标域的故障类型伪标签待预测。由于数据增强需要标签的参与,同时样本特征的近邻吸引与同批分散loss需要所有样本的特征。因此这一步需要生成对应伪标签以及所有样本的特征库。对于伪标签生成模块,需要输入目标域样本的对应特征以及预测输出,原理为利用原型,即类级的特征质心,来产生更可靠的伪标签。为对应的类别为k的输出,因此为样本在类别k上的预测输出。可以用如下公式表示:
28、(4)
29、针对目标域进行类级的初始原型(质心)计算公式如下:
30、(5)
31、由于原型对离群值不那么敏感,它们可以更稳定地表征目标域内不同类别的分布。可以通过距离度量来首次计算初始伪标签:
32、(6)
33、然后,使用初始标签再次更新原型,以计算更准确的伪标签。其中算法表示当输入为真时输出数值1,该过程被描述为:
34、(7)
35、(8)
36、有了伪标签,便可以输入数据增强模块进行数据增强,同理,它需要输入随机两个故障样本和,以及对应的伪标签和 ,总体生成过程与源域生成过程相似,每一次都由随机生成的窗口win的大小决定。新标签计算方式如下:
37、(9)
38、将初始目标域域数据集经过数据增强模块得到的新数据集记为。将数据集与数据集和与之对应的伪标签整合,得到新目标域数据集,公式如下:
39、(10)
40、其中表示源域整合样本中的第个振动信号,为振动信号对应的故障类型的伪标签。此时,便可以提取所有样本的特征。在这个过程中,故障分类模型的特征提取器输出可以再被简化为特征,所有特征的集合被称为。
41、进一步,在所述s4步骤中,将步骤s3新目标域数据集的所有样本输入s2步骤中的故障分类模型。故障分类模型根据伪标签,通过标签平滑交叉熵损失函数进行自监督学习训练。故障分类模型对应目标域训练的标签平滑交叉熵损失函数结果求平均计算得到,计算方式如下:
42、(11)
43、与此同时,对于新引入的“样本特征的近邻吸引与同批分散loss”来说,其原理是利用源域样本训练好的训练模型,以样本在特征上的余弦相似度距离关系为依据,通过聚合特定特征空间内样本在局部领域特征相似的预测、远离特征不相似的预测,来训练模型。其中,所有特征的集合在步骤s3被整合为,分类器的预测输出记为,所有输出的集合被称为。每一个样本的特征,都有包含在内的个近邻特征(距离为余弦相似度)组成的特征集合,以及不属于的背景特征集合,为了使训练简单化,使用小批量中除以外的所有其他特征作为。训练之后,都会计算样本特征的近邻吸引与同批分散loss结果,并求平均得到,其计算方式如下:
44、(12)
45、其中,表示的转置,超参数会从1开始,随着训练的进行开始衰减。通过不断迭代训练,使得故障分类模型会逐渐学习到域不变特征的提取,并且利用模型内源域的知识完成从源域到目标域的无源领域自适应。综合上述公式,s4步骤中损失函数可以定义出总损失函数如下:
46、(13)
47、总损失函数公式(13)通过sgd随机梯度下降法的不断迭代训练,更新网络的权重参数,使得未标记类型的目标域样本通过故障分类模型可以输出准确预测的对应样本标签。
48、本发明的另一目的在于提供一种实现所述基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类系统,包括:
49、数据增强模块,用于对源域和目标域进行数据增强,获得新增的样本以及样本标签;
50、深度卷积神经网络,将新源域数据集的所有样本输入一维resnet18深度卷积神经网络,获得基于源域的轴承故障类型分类预训练模型;
51、模型训练模块,将源域训练后的故障分类模型包含参数输入模型训练模块,以此为基础,利用伪标签与拉近特征空间内相似样本的预测、远离同批次样本特征的预测进行无监督训练;
52、伪标签生成模块,将目标域样本的对应特征以及softmax预测输出输入伪标签模块,以生成对应样本的伪标签;
53、预测标签生成模块,用于通过故障分类模型的分类器输出准确的目标域样本的预测标签。
54、本发明的另一目的在于提供一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的基于无源领域自适应的轴承故障类型方法的步骤。
55、本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行所述的基于无源领域自适应的轴承故障类型方法的步骤。
56、本发明的另一目的在于提供一种信息数据处理终端,信息数据处理终端用于实现所述的基于无源领域自适应的轴承故障类型系统。
57、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
58、第一,在相同的实验数据条件下,通过一维resnet-18深度卷积神经网络对数据进行处理,能有效避免将一维振动信号内部结构进行破坏,可以获得更好的鉴别特性,取得更好的识别率,同时拥有较快的训练速度和识别速度。
59、对源域和目标域数据集使用数据增强模块进行数据增强,从而扩充了数据训练样本的容量,规避了过度拟合的风险,提升了模型的鲁棒性。
60、对于用源域样本训练好的训练模型,以样本在特征上的余弦相似度距离关系为依据,通过聚合特定特征空间内样本在局部领域特征相似的预测,远离特征不相似的预测,从而实现高效的特征聚类和聚类分配,更有利于更多振动类型的区分。
61、本发明最大的亮点在于应用一维resnet-18深度卷积神经网络和数据增强方法,在确保神经网络在提高训练速度与质量的同时不会出现明显的过拟合现象。并且使用“样本特征的近邻吸引与同批分散”loss,有效的提高了最终分类故障模型振动类型的区分,从而做到在脱离源域数据集进行无监督训练的前提下,依然有效缓解源域与目标域之间存在的领域差异的影响,提高了分类故障模型的鲁棒性。
62、第二,传统的方法将一维震动信号转换为二维信号,这通常导致信息丢失和训练中的无效信息。的新发明直接使用一维深度网络进行学习,有效提高了信息利用效率、减少了无效信息的训练,并简化了模型结构。
63、传统的方法较少使用数据增强技术,然而现实中往往目标域数据集是较少样本容量的数据集,这通常导致模型参考不够充分,出现过拟合现象。的新发明使用数据增强模块进行数据增强,从而扩充了数据训练样本的容量,规避了过度拟合的风险。
64、传统的方法大多数完全依靠伪标签来进行训练,而忽略了伪标签本身存在噪声标签这一无法避免的问题。的新发明创新性的引入了样本特征的近邻吸引与同批分散loss,这个损失不依靠伪标签,而是根据样本特征的余弦相似度距离进行运算。
65、第三,本项技术创新可在无源领域自适应的基础上面向包含工业自动化设备的企业进行技术转化,特别是在石化工业和制造业等领域,其中大量轴承部件参与生产过程。通过直接使用一维深度网络进行学习,该技术有望显著提高轴承健康状况的监测性能,实现及时有效的预警,以适应复杂环境,从而避免因轴承故障导致的生产事故和生产停顿,降低企业潜在的生产风险,推动企业实现生产质量的提升和效益的增长。
66、第四,轴承故障诊断技术目前主要依赖于无监督领域自适应方法。但在许多实际场景中,这样的条件是不合适的,原因是源域数据集并不总是可访问的,这是由于隐私保护或知识产权问题。而更符合实际情况的无源领域自适应方法尚未得到充分关注和研究。针对轴承故障诊断技术在复杂生产环境下无源领域自适应方法性能下降的问题,本发明提出了一种新的方法。这种方法在领域自适应时完全脱离源域数据集,使无源领域自适应方法成为轴承故障诊断的现实问题。为了实现这一目标,本发明采用了数据增强、一维深度卷积神经网络等先进工具,并创新性地引入了样本特征的近邻吸引与同批分散loss来进行训练。这提供了一个针对无源领域自适应情形下轴承故障诊断的有效技术方案,有助于改善实际生产复杂环境下轴承健康状况监测的效果。
67、第五,已有的无源领域自适应技术方案大多数完全依靠伪标签来进行训练,而忽略了伪标签本身存在噪声标签这一无法避免的问题。为了解决这个问题,本发明在模型设计过程中综合考虑了样本在局部领域特征相似的预测,远离特征不相似的预测,从而实现高效的特征聚类和聚类分配,更有利于更多振动类型的区分。此外,本发明还直接采用了一维深度网络进行学习。传统的做法通常是将一维振动信号转换为二维信号后再输入深度网络,但这样做往往会导致信息的丢失和引入无效信息。而直接使用一维深度网络进行学习则可以有效提高信息的利用效率,减少无效信息的干扰,并简化模型的结构。这样的设计使得模型能够更直接地处理一维振动信号,从而更好地捕捉到信号中的有用信息,提高故障诊断的准确性。
68、第六,长期以来人们对于轴承故障诊断技术的领域迁移研究主要集中在经典的无监督领域自适应方面,而对于实际环境中的无源领域自适应关注不够。目前的大多数发明往往直接假设能够获得源域的数据集。但大多数情况下,由于数据安全和数据量大等原因,并不能直接获得源域相关的数据集。而随着生产环境日益复杂,轴承故障诊断技术面临无源领域自适应方法性能下降的问题。因此本发明提出训练模型在领域自适应时完全脱离源域数据集的情况下,依然获得了不错的分类成果,更适合实际生产环境使用。
69、1. 无源领域自适应:此方法显著的特点在于实现了无源领域自适应。这意味着在源域模型训练完成后,迁移过程不再需要源域样本的参与。这在实际应用中具有很大优势,因为源域数据由于隐私、安全或存储限制等原因无法持续访问。通过这种方法,模型能够在不依赖源域数据的情况下,自适应地迁移到目标域,从而提高了模型的灵活性和实用性。
70、2. 近邻吸引与同批分散loss:在目标域的训练过程中,该方法引入了近邻吸引与同批分散loss进行无监督学习训练。这种损失函数的设计使得模型能够更好地捕捉到目标域样本之间的内在关系,从而提高了模型对目标域数据的分类准确性。
71、3. 原型与伪标签的迭代更新:伪标签生成过程中,通过原型(类级的特征质心)和伪标签的迭代更新,可以生成更可靠的伪标签。这种方法提高了伪标签的质量,有助于模型在目标域上进行更准确的分类。
1.一种基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类系统,其特征在于,该系统包括:
2.如权利要求1所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类系统,其特征在于,还设置有轴承故障类型分类系统,该系统适应于无源领域自适应,包括:
3.一种基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,其特征在于,包括以下步骤:
4.如权利要求3所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,其特征在于,通过源域样本训练好源模型之后,模型的迁移不再需要源域样本的参与;
5.如权利要求3所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,其特征在于,在s1中,取得振动信号数据集作为初始源域数据集;将类别的数量记为k,初始源域数据集记为,其中表示初始源域样本中的第个振动信号,而表示对应的故障类型标签,则是初始源域样本的数量;对于数据增强模块,它需要输入随机两个故障样本和,以及对应的标签和 ,而数据增强模块本身会计算样本的长度以及随机生成的窗口长度win;在每次训练时,数据增强模块都会以概率执行数据增强操作,从故障样本和故障样本以随机的相同位置截取窗口,然后将窗口的内容覆盖掉中窗口的内容,得到混合之后的新样本,而新标签计算方式如下所示:
6.如权利要求3所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,其特征在于,在s2中,其一维resnet18深度卷积神经网络包含特征提取器以及分类器,将新源域样本输入特征提取器提取的样本特征命为,然后将样本特征输入分类器f,得到源域的样本预测输出;对一维resnet18深度卷积神经网络使用标签平滑交叉熵损失函数进行有监督学习训练,获得基于源域训练的故障分类模型;标签平滑交叉熵损失函数包括对样本标签进行标签平滑操作,目标是通过向正确类别的标签添加噪声,使其不再是完全的0和1,而是接近0和1的值;通过标签平滑交叉熵损失函数的计算,提高故障分类模型对源域的预测标签的准确率;对于源域训练的故障分类模型,其标签平滑交叉熵损失函数结果求平均,得到,计算方式如下:
7.如权利要求3所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,其特征在于,在s3中,取得振动信号数据集作为初始目标域数据集,记为,其中表示第 个目标域样本的振动信号,而则是目标域样本的数量;目标域的故障类型伪标签待预测;由于数据增强需要标签的参与,同时样本特征的近邻吸引与同批分散loss需要所有样本的特征;因此这一步需要生成对应伪标签以及所有样本的特征库;对于伪标签生成模块,需要输入目标域样本的对应特征以及预测输出,原理为利用原型,即类级的特征质心,来产生更可靠的伪标签;为对应的类别为k的输出,因此为样本在类别k上的预测输出;可以用如下公式表示:
8.如权利要求3所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类方法,其特征在于,在s4中,将步骤s3新目标域数据集的所有样本输入s2步骤中的故障分类模型;故障分类模型根据伪标签,通过标签平滑交叉熵损失函数进行自监督学习训练;故障分类模型对应目标域训练的标签平滑交叉熵损失函数结果求平均计算得到,计算方式如下:
9.一种实现如权利要求3~8任意一项所述分类方法的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类系统,其特征在于,包括:
10.根据权利要求7所述的基于数据增强、标签平滑与特征优化的无源领域自适应轴承故障分类系统,其特征在于,所述数据增强模块能够执行基于随机选择的两个样本执行数据混合,通过在故障样本之间随机选取相同位置的窗口进行内容覆盖,生成新的样本和对应的混合标签;