基于CEEMD能量算子和XGBoost的滚动轴承故障诊断

时间:2023-08-18 11:15:02 来源:网友投稿

王昊天

(重庆交通大学机电与车辆工程学院,重庆 400074)

滚动轴承被认为是旋转机械中的关键部件之一,许多机械设备停工都是因其故障引起的,其健康状况直接关系到整个机械系统的运行。为使机械设备稳定工作,减少非生产时间,避免发生灾难性故障对机器和人的生命造成损害,应对滚动轴承故障进行准确诊断和分析。

振动信号被广泛应用于滚动轴承故障诊断中,对信号进行优化处理提取特征,是进行故障诊断的主要手段。滚动轴承的振动信号是非平稳、非线性的,如何从中提取有效故障信息,准确诊断并识别轴承状态是当前研究的热点。针对振动信号的特点,将时频分析技术引入旋转机械故障诊断中。Huang et al.[1]于1998年提出的经验模态分解(EMD)可将信号自适应分解为多个固有模态函数(IMF),非常适合非平稳、非线性的振动信号,目前已成功应用于滚动轴承故障诊断中[2-4]。但EMD存在模态混淆的缺陷,为解决此问题,Wu et al.[5]研究白噪声信号的统计特性后提出了集合经验模态分解(EEMD)。为了提高分解效率,Yeh et al.[6]提出了一种互补集合经验模态分解(CEEMD),向原始信号中添加2个相反的白噪声信号,并对每个噪声情况分别执行EMD,该算法有效减少了白噪声对原始信号的影响。

极端梯度提升(XGBoost)树模型是近年来被广泛使用的一种模式识别分类方法。Chen et al.[7]提出的XGBoost算法是目前最快、集成度最高的决策树算法。该算法融合了梯度提升、随机森林等算法的优势,创造性地提出了模型的离散意识和离核计算方法,不仅提升了算法模型对分布式数据库的预测效果,也大大提高了模型训练的速度。

受以上研究的启发,本文提出一种基于CEEMD能量算子和XGBoost树模型的滚动故障诊断方法。使用CEEMD算法对原始振动信号进行分解,然后提取各IMF分量中能量算子这一特征,并将特征值输入到XGBoost模型进行训练,最后使用需要训练完毕的模型对滚动轴承的4种故障进行分类识别。通过对滚动轴承故障试验数据进行实验分析,验证该模型的有效性。

1.1 CEEMD算法概述

EEMD算法可以在一定程度上抑制EMD算法中的模态混淆现象,但添加的白噪声并不能完全中和。针对此缺陷提出CEEMD算法,在分析信号中成对加入符号相反的白噪声,降低重构误差。CEEMD算法的详细步骤如下。

步骤1:成对添加符号与原始信号相反的白噪声信号,如式(1)所示。

(1)

式中:X为原始信号序列;
Ni为第i次添加的白噪声序列。

步骤3:取各分量的均值得:

(2)

(3)

步骤4:将n次叠加白噪声迭代产生的分量相加并求均值,最后得到CEEMD结果:

(4)

式中:cj是CEEMD分解后的第j个模态分量。

1.2 能量算子的求解

能量算子的求解过程如下。

步骤1:对滚动轴承的振动信号进行CEEMD分解,获得各IMF分量和残差。

步骤2:求各个IMF分量的能量算子E,如公式(5)所示。

(5)

式中:N为样本中采样点数;
Δcj=cj2-cj(t-1)cj(t+1)。

XGBoost使用的是CART回归树模型,该算法的思想为:不断添加树,即不断分割特征生成树。它本质上是学习一个新的函数来拟合先前预测的残差,然后重新装配,直到满足要求。假设XGBoost模型本身由K个CART组成,则模型可以表示为:

(6)

XGBoost与大多数机器学习模型类似,其目标函数可以是损失函数和正则项之和,分别控制模型的准确度和复杂度,具体公式如下。

(7)

(8)

(9)

式中的优化过程与泰勒展开式(10)近似,以t步优化为例,优化目标函数如下。

f(x+Δx)=f(x)+f′(x)x+f″(x)Δx

(10)

(11)

(12)

(13)

式中:gi和hi分别为损失函数第一和第二步统计。

在去除式(11)中的常数项后,获得以下简化目标。

(14)

3.1 数据简介

为验证本文方法,采用美国凯斯西储大学轴承数据集。该实验使用轴承为6205-2RSJ型轴承,数据集分为48K基线、12K驱动端故障、48K驱动端故障、12K风扇端故障共4类,每个子故障数据集均有滚子、内圈、外圈故障数据。本文使用48K基线和12K驱动端故障数据,其中主轴转速1 772 r/min,故障直径0.021 mm,加速度传感器位于电机的驱动端,采样频率12 kHz。

使用重叠采样的方式对数据进行随机分割,每类状态(健康、滚子故障、内圈故障、外圈故障)400个样本,共1 600个样本,按照8:2的比例划分为训练集和测试集。本文所选用数据中轴承转速为1 772 r/min,根据N=fs×60/ns可得每个周期内采样点数为406个,为保证每个数据样本故障信息的完整性,设置每个样本长度为2 048个采样点。

3.2 基于CEEMD的故障特征提取

本文以滚子故障中某一样本为例进行分析,原始振动信号如图1所示。对该样本使用CEEMD算法进行分解,本文设置分解为6个IMF分量。因IMF分量很多,若不进行筛选而使用所有IMF分量,计算过程会过于冗余。因此,仅选取IMF分量中包含原始信号信息较多的几个分量,本文使用4个分量。选取原则为:计算比较各IMF分量与未分解前原始信号的相关系数。

图1 滚子故障原始信号及CEEMD分解图

该样本经过CEEMD分解后的各IMF分量与原始信号的相关系数如表1所示。IMF分量1~4相关系数较大,相关系数排名前4的IMF分量已经包含有原始信号中存在的主要信息,故使用前4名IMF分量。

表1 各IMF分量与原始信号的相关系数

对排名前4的IMF 1~4分别提取能量算子作为特征值,如表2所示。

表2 各IMF分量的特征值

重复上述过程对全部1 600个样本进行CEEMD分解,对相关系数排名前4的IMF分量分别提取能量算子作为特征值。

3.3 基于XGBoost树模型的故障识别

将获得的特征矩阵按照类别分别划为0类、1类、2类和3类,其中0类代表滚子故障,1类代表健康,2类代表内圈故障,3类代表外圈故障。将数据按照8:2的比例划分为训练集与测试集(训练集有1 280个样本,测试集有320个样本),将训练集输入模型。模型参数中的最大深度设置为50,学习率设置为0.05,其他参数均为默认值。模型训练完毕后,用测试集进行测试,测试准确率为97%。准确率的公式为:

(15)

式中:TP为正确识别的阳性样本数量;
TN为正确识别的阴性样本数量;
FN为错误识别的阳性样本数量;
FP为识别错误的阴性样本数量。

其混淆矩阵如图2所示。滚子故障样本中有1个样本误判为健康;
健康样本中有1个样本误判为滚子故障,有3个样本误判为内圈故障;
内圈故障样本中有2个样本误判为健康;
外圈故障样本中全都预测正确。总体预测效果较优。

图2 XGBoost模型测试混淆矩阵

本文提出了一种利用CEEMD和XGBoost模型分析振动信号来识别滚动轴承故障的方法。实验结果表明:CEEMD算法分解振动信号后提取的能量算子作为特征,通过XGBoost数模型可以较好地实现识别故障类型,证明了本文方法的有效性。

猜你喜欢滚子算子分量与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性数学物理学报(2022年5期)2022-10-09圆锥滚子轴承半凸滚子的优化研究哈尔滨轴承(2021年1期)2021-07-21拟微分算子在Hp(ω)上的有界性数学物理学报(2021年2期)2021-06-09帽子的分量基层中医药(2021年12期)2021-06-05仿真模拟在多联推力滚子轴承研发中的应用哈尔滨轴承(2021年4期)2021-03-08各向异性次Laplace算子和拟p-次Laplace算子的Picone恒等式及其应用应用数学(2020年2期)2020-06-24一物千斤智族GQ(2019年9期)2019-10-28一类Markov模算子半群与相应的算子值Dirichlet型刻画数学年刊A辑(中文版)(2018年2期)2019-01-08论《哈姆雷特》中良心的分量英美文学研究论丛(2018年1期)2018-08-16满滚子径向自锁轴承的优化设计轴承(2018年10期)2018-07-25

推荐访问:算子 故障诊断 能量