本发明属于新能源,具体涉及一种基于概率特征挖掘的风力发电机叶片故障判别方法。
背景技术:
1、在风力发电机叶片故障的早期阶段对风力发电机叶片故障进行高效、准确的判别可以为工程师快速采取有效的解决方案提供有价值的指导,预防后续更加严重的故障发生,从而减少风电机组不必要的停机,最大限度地减少叶片故障造成的经济损失;现有研究中提出的风力发电机叶片故障产生的原因有雷击、疲劳、前缘侵蚀、结冰等,目前,现有方法常采用应力测量,声学检测,超声波测量,振动测量等方式用以判别叶片故障,由于传统物理检测方法缺乏对真实情况的全面考虑,使得判别结果准确度不佳;振动测量法具备灵敏度高,适用性广等优点,目前的振动测量法为深度学习和神经网络模型法,但振动测量法的可解释程度较低,因此不具备大规模工程应用的适用性,另一方面,由于振动信号测量易受外界环境变化及风机系统自身振动“噪音”的影响,直接应用可解释性强的机器学习方法对风机叶片故障振动信号进行判别,会导致所获取的判别准确性较低,此外,采样数据的原始特征过于简单或不足以完整描述数据的底层结构时,会加大获取真实结果的难度,综上所述,目前急需一种既具备可解释性,又能够在工程应用中高度适用的风力发电机叶片故障判别方法。
技术实现思路
1、本发明要解决的技术问题是提供一种通过大数据学习和建模,通过识别和提取数据的规律和特征,自动化地完成数据处理分析工作,具备较高判别效率和准确性的风力发电机叶片故障判别方法。
2、本发明的技术方案为:一种基于概率特征挖掘的风力发电机叶片故障判别方法,包括以下步骤:
3、步骤1、对风力发电机叶片振动信号数据进行采集;
4、步骤2、对采集的风力发电机叶片振动信号数据进行数据预处理;
5、步骤3、粗筛判别数据状态:建立最优数据量判别策略,提取概率特征并分类以对数据进行粗筛,将粗筛后的数据输分为健康状态和故障状态,若筛后的数据为健康状态则判定数据状态为健康状态,若粗筛后的数据为故障状态则进行下一步数据细筛;
6、步骤4、细筛判别数据状态:建立最优极值搜索模型,挖掘最优极值数据,根据极值切割原始振动信号数列得到数值为正的振动信号数列和数值为负的振动信号数列,保留最优极值外数据,形成新的振动信号矩阵并从中提取四种风机叶片故障类别的概率特征,对四种风机叶片故障类别的概率特征进行相似性分析和欧氏距离测度;
7、步骤5、对四种不同风机叶片故障类别的振动信号特性进行画像。
8、进一步地,步骤1中所述风力发电机叶片振动信号为风力发电机叶片高频振动信号,风力发电机叶片高频振动信号数据集f的表达式为:
9、,其中n表示总采集次数,表示第n次采样的振动信号数据。
10、进一步地,步骤2中所述数据预处理包括以下步骤:对原始数据进行标准化处理、清除原始数据中的缺失值和不相关数据、保存原始数据异常值、特征选择;所述标准化处理的表达式为:
11、,其中,表示数据集中各特征值的标准化值,表示第n次采样的振动信号数据的平均值,是一个数列,包含第一次采样的振动信号数据,包含第n次采样的振动信号数据。
12、进一步地,步骤3中所述粗筛是对处理过的数据进行初步分类,粗筛包括以下步骤:一、执行最优数据量判别:即在约束条件下最小化所需数据量,二、将判别过的数据输入分类模型区分出健康状态和故障状态;所述最小化所需数据量的表达式为:
13、,其中,为单次采样的最大数据量;
14、所述约束条件的表达式为:
15、,其中,表示分类准确率,表示满足分类准确率的最小数据量,表示整数。
16、更进一步地,所述健康状态和故障状态的表达为:
17、,其中,表示标签特征矩阵,表示第n列标准化处理后的数据的标签,当时,表示叶片处于健康,当时,表示叶片处于故障状态;
18、所述标准化处理后的数据转换为中心矩,转换后的特征矩阵表示为:
19、,其中,表示中心矩特征矩阵,表示矩阵转置,表示2-6阶中心矩数据矩阵;
20、所述的表达式为:
21、,其中,表示第n组采样结果的第i阶中心矩数据。
22、进一步地,步骤4中所述最优极值搜索模型的表达式为:
23、,其中,表示振动信号极值为情况下数列中的最小值,表示最优极值,表示振动信号极值为 e情况下欧氏距离的最小值,为距离矩阵,表示每两种故障间的欧氏距离;
24、所述数值为正的振动信号数列落入区间:
25、,其中,表示数值为正的振动信号的极值;
26、所述数值为负的振动信号数列落入区间:
27、,其中,表示数值为负的振动信号的极值;
28、所述数值为正的振动信号数列和数值为负的振动信号数列采用最小-最大标准化方法对其中心矩数据进行分析和比较,所述最小-最大标准化方法为计算第种故障的第阶中心矩数据,所述第种故障的第阶中心矩的标准化表达式如下:
29、,其中,表示标准化后的第种故障的第阶中心矩,表示第种故障的第阶中心矩,表示矩阵中第阶中心矩数列中的最小值,指矩阵中第阶中心矩数列中的最大值;
30、所述四种风机叶片故障类别分别为:叶片裂纹故障、叶片侵蚀故障、叶片质量不平衡故障和叶片扭转故障,所述四种风机叶片故障类别中的两种故障类别之间的空间中概率特征的欧氏距离表达式为:
31、,其中,表示矩计算的最高阶次,且此处,表示点和点之间的欧氏距离,和分别表示空间中的两个点,和分别表示点和点在第维度上的坐标值;
32、所述四种风机叶片故障类别的概率中心矩矩阵的表达式为:
33、,其中,表示四种故障的中心矩矩阵,表示矩阵转置,表示四种风机叶片故障类别集合,分别为:叶片裂纹故障,叶片侵蚀故障,叶片质量不平衡故障,叶片扭转故障;
34、则第种风机叶片故障类别的概率中心矩矩阵的表达式为:
35、,其中,表示种故障的中心矩矩阵,表示第种故障的第阶中心矩;
36、所述四种风机叶片故障类别中的一种风机叶片故障类别与其他风机叶片故障类别之间的欧氏距离的表达式为:
37、,其中,表示一种风机叶片故障类别与其他风机叶片故障类别之间的欧氏距离,表示第种故障类别和第种故障类别的集合,表示第种故障类别和第种故障类别之间的欧氏距离值。
38、进一步地,步骤5中所述画像为采用可视化手段展示四种不同风机叶片故障类别的振动信号特征和分析结果。
39、本发明的有益效果:本发明的一种基于概率特征挖掘的风力发电机叶片故障判别方法通过引入概率特征分析及中心矩特征重构技术,相较于现有的物理检测方法,能更全面地考虑风力发电机叶片故障的可能性范围,为工程师提供更可靠的决策支持;通过建立一个全新的机器学习及数据处理框架,并采用可解释性前的机器学习和统计学方法,提升了故障判别的准确性及可靠性;通过进行最优极值的挖掘从而找到典型的故障类别的振动信号的特性并采用可视化方式展示,使得工程师能方便快捷的查阅和理解关键信息,提高了故障判别工作的效率和准确性;通过建立最优采样数据量判别及最优极值切割策略,提高了数据采样和极值分析的效率;通过将阶中心矩概率分析集成到特征工程中,创建新的特征组合和交互项,使得模型的复杂度和表达能力得以提升;通过使用阶矩作为原始数据的衍生特征,使得数据的内在特性得以揭示,使得数据模型的构建更加全面和准确;综上,本发明的一种基于概率特征挖掘的风力发电机叶片故障判别方法通过对风力发电机叶片振动信号数据进行大数据学习和建模,并识别和提取数据的规律和特征,并自动化地完成数据处理、粗筛、细筛等任务,极大地提高了风力发电机叶片故障的判别效率和准确性。
1.一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,步骤1中所述风力发电机叶片振动信号为风力发电机叶片高频振动信号,风力发电机叶片高频振动信号数据集f的表达式为:
3.根据权利要求1所述的一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,步骤2中所述数据预处理包括以下步骤:对原始数据进行标准化处理、清除原始数据中的缺失值和不相关数据、保存原始数据异常值、特征选择;所述标准化处理的表达式为:
4.根据权利要求1所述的一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,步骤3中所述粗筛是对处理过的数据进行初步分类,粗筛包括以下步骤:一、执行最优数据量判别:即在约束条件下最小化所需数据量,二、将标准化处理后的数据输入分类模型区分出健康状态和故障状态;所述最小化所需数据量的表达式为:
5.根据权利要求4所述的一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,所述健康状态和故障状态的表达为:
6.根据权利要求1所述的一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,步骤4中所述最优极值搜索模型的表达式为:
7.根据权利要求1所述的一种基于概率特征挖掘的风力发电机叶片故障判别方法,其特征在于,步骤5中所述画像为采用可视化手段展示四种不同风机叶片故障类别的振动信号特征和分析结果。