本发明涉及变压器故障诊断,具体涉及一种基于rfecv的变压器故障表征特征量筛选方法。
背景技术:
1、油浸式电力变压器是电力系统中关键的设备之一,在输配电中起着重要的作用,其一旦发生故障,将造成大面积停电和不可估量的经济损失。变压器在发生放电或过热故障时,变压器油会产生不同组合和含量的特征气体,而有效提取油中溶解气体信息对开展变压器故障预警及诊断具有积极作用。基于油中溶解气体的三比值法原理简单,但其应用存在诊断精度低和过于依赖运维人员的现场经验等问题,易造成故障的误判和漏判;人工智能诊断方法主要通过h2、ch4、c2h6、c2h4和c2h2作为输入特征量,但气体浓度不能全面地反映故障和特征量之间的内在联系,难以发挥人工智能优势。因此,若能对油中溶解气体进行特征筛选,剔除冗余特征,选取能直接表征变压器故障的特征量,对提高变压器故障诊断精度具有重要意义。
2、针对变压器故障表征特征量筛选问题,现有的方法大多基于经验或统计分析,如三比值法根据变压器油中溶解气体组分含量,提取到了c2h2/c2h4、ch4/h2和c2h4/c2h6特征量;或采用方差分析或卡方检验挖掘故障和特征之间的联系,剔除相关性较弱的特征量。上述方法在特征量筛选及获取方面取得了一定的成果,但仍存在一定的问题:(1)特征筛选结果的验证过程极易受数据质量和人为经验的影响;(2)特征之间除了存在线性关系,还存在一定的差异关系或其他关系,无法被一般性统计方法识别;(3)传统故障诊断方法无法建立起故障和特征量的直接联系,降低了故障诊断模型的实用价值。
技术实现思路
1、针对现有技术存在的问题,本发明的目的在于提供一种基于rfecv的变压器故障表征特征量筛选方法,该方法可结合变压器故障智能诊断算法,筛选表征变压器故障的最佳特征组合,克服传统特征量筛选中人工经验的依赖性及统计方法的局限性,实现变压器故障诊断及决策可视化,提高变压器故障诊断的科学性和实用性。
2、为达到此发明目的,本发明采用以下技术方案,一种基于rfecv的变压器故障表征特征量筛选方法,包括如下步骤:
3、s1:收集已知变压器运行状态的变压器油色谱数据,构建变压器样本集,其中,油色谱数据包括h2、ch4、c2h6、c2h4和c2h2含量;故障类型为以下6种之一:低中温过热、高温过热、局部放电、低能放电、高能放电或其他;
4、s2:对变压器样本进行特征衍生处理,形成高维特征样本集;
5、s3:将变压器高维特征样本集分为训练集和测试集;构建变压器故障诊断模型,融合特征递归消除法和交叉验证(rfecv)方法遍历特征序列,逐次剔除重要度最低的特征量;
6、s4:绘制诊断模型在训练集和测试集的泛化曲线,输出满足诊断精度要求的最佳特征组合和最优诊断模型,并实现诊断决策可视化。
7、进一步的,s2中对变压器样本数据进行特征衍生,共得到28个特征量。
8、 序号 特征量 序号 特征量 1 tg 15 <![cdata[c<sub>2</sub>h<sub>4</sub>/c<sub>2</sub>h<sub>6</sub>]]> 2 th 16 <![cdata[c<sub>2</sub>h<sub>4</sub>/tg]]> 3 <![cdata[h<sub>2</sub>/ch4]]> 17 <![cdata[c<sub>2</sub>h<sub>6</sub>/tg]]> 4 <![cdata[h<sub>2</sub>/c<sub>2</sub>h<sub>2</sub>]]> 18 <![cdata[(ch<sub>4</sub>+c<sub>2</sub>h<sub>6</sub>)/tg]]> 5 <![cdata[h<sub>2</sub>/c<sub>2</sub>h<sub>4</sub>]]> 19 <![cdata[(ch<sub>4</sub>+c<sub>2</sub>h<sub>4</sub>)/tg]]> 6 <![cdata[h<sub>2</sub>/c<sub>2</sub>h<sub>6</sub>]]> 20 <![cdata[(ch<sub>4</sub>+c<sub>2</sub>h<sub>2</sub>)/tg]]> 7 <![cdata[h<sub>2</sub>/tg]]> 21 <![cdata[(c<sub>2</sub>h<sub>4</sub>+c<sub>2</sub>h<sub>6</sub>)/th]]> 8 <![cdata[ch<sub>4</sub>/c<sub>2</sub>h<sub>2</sub>]]> 22 <![cdata[(c<sub>2</sub>h<sub>4</sub>+c<sub>2</sub>h<sub>2</sub>)/th]]> 9 <![cdata[ch<sub>4</sub>/c<sub>2</sub>h<sub>4</sub>]]> 23 <![cdata[(c<sub>2</sub>h<sub>6</sub>+c<sub>2</sub>h<sub>2</sub>)/th]]> 10 <![cdata[ch<sub>4</sub>/c<sub>2</sub>h<sub>6</sub>]]> 24 <![cdata[h<sub>2</sub>/th]]> 11 <![cdata[ch<sub>4</sub>/tg]]> 25 <![cdata[(h<sub>2</sub>+ch<sub>4</sub>)/th]]> 12 <![cdata[c<sub>2</sub>h<sub>2</sub>/c<sub>2</sub>h<sub>4</sub>]]> 26 <![cdata[(h<sub>2</sub>+c<sub>2</sub>h<sub>4</sub>)/th]]> 13 <![cdata[c<sub>2</sub>h<sub>2</sub>/c<sub>2</sub>h<sub>6</sub>]]> 27 <![cdata[(h<sub>2</sub>+c<sub>2</sub>h<sub>6</sub>)/th]]> 14 <![cdata[c<sub>2</sub>h<sub>2</sub>/tg]]> 28 <![cdata[(h<sub>2</sub>+c<sub>2</sub>h<sub>2</sub>)/th]]>
9、其中,tg代表含烃类气体浓度之和,th代表含氢类气体浓度之和。
10、进一步的,s3中分类回归树算法可以换成神经网络、支持向量机、梯度提升树、随机森林等适用于分类问题的算法。
11、进一步的,s3中基于rfecv算法剔除对故障诊断影响度最低的特征量,具体步骤如下:
12、s3.1:构建基于分类回归树的变压器故障诊断模型,作为rfecv方法的基学习器;
13、s3.2:采用随机搜索算法实现分类回归树模型的参数寻优,并进行变压器故障诊断分析,评估不同特征量对故障诊断的重要度;
14、s3.3:利用rfecv方法对特征量的重要度进行排序,剔除重要度最低的特征量,重构变压器样本集;
15、s3.4:重复上述步骤,直到遍历最后一个特征量。
16、进一步的,s4中优选新特征组合及诊断决策可视化主要步骤为:
17、s4.1:绘制诊断模型在训练集和测试集的泛化曲线,当两者精度都大于87%,且泛化误差在3%之间,则筛选最佳特征组合,并输出对应的最优诊断模型;
18、s4.2:根据最佳特征组合,利用分类回归树模型的树状结构,实现变压器故障的准确诊断及决策可视化。
19、本发明的有益效果:
20、本发明提供的一种基于rfecv的变压器故障表征特征量筛选方法,能够得到有效反映油色谱数据信息的特征组合,同时可以推广到变压器在线监测、离线试验和运维检修中的有效数据,实现优质的高维特征量筛选,一方面可提升变压器故障诊断效果,一方面也为变压器故障诊断提供高质量的备选特征量,将极大程度提升变压器故障诊断的科学性和实用性。
1.一种基于rfecv的变压器故障表征特征量筛选方法,其特征在于:包括如下步骤:
2.如权利要求1所述的一种基于rfecv的变压器故障表征特征量筛选方法,其特征在于:s2中对变压器样本集进行特征衍生处理,共得到如下28个特征量;
3.如权利要求1所述的一种基于rfecv的变压器故障表征特征量筛选方法,其特征在于:s3中变压器故障诊断模型采用分类回归树、神经网络、支持向量机、梯度提升树或随机森林等分类算法。
4.如权利要求3所述的一种基于rfecv的变压器故障表征特征量筛选方法,其特征在于:s3中基于rfecv算法剔除重要度最低的特征量,具体步骤如下:
5.如权利要求4所述的一种基于rfecv的变压器故障表征特征量筛选方法,其特征在于:s4包括以下步骤:
