叶禹含,郑小霞,王 静,杨爽勉
(上海电力大学自动化工程学院,上海 200090)
轴承是机械装备中至关重要的组件,其状态会影响整个系统的稳定性[1-2]。不仅本身容易发生故障,因其与其他部件紧密相连,随着轴承故障程度加深会影响其他元器件的正常运行,可能会使整个系统停机,甚至会造成人员伤亡[3]。
实际采集到的轴承信号由多种模态混叠在一起,通常包含大量环境噪声,需要实施降噪。王普等[4]利用小波分解对轴承信号进行处理后,对高频段的小波系数设置阈值分层自适应处理,但是小波变换的冗余度较大。ZHENG等[5]提出一种自适应均匀相位经验模态分解法,可以自适应的叠加正弦波的幅值大小,该方法对模态混叠现象处理有一定的成效,但是计算量比较大。粒子滤波(particle filter,PF)作为一种强适应性滤波方法,在信号降噪等方面有非常明显的优势[6-7]。刘云涛[8]提出一种蝴蝶算法优化的粒子滤波算法。CHEN等[9]提出一种用带变异算子的粒子群改进粒子滤波算法,改善了粒子多样性。但是以上智能算法的参数相对较多,增加了算法复杂程度。
经过降噪处理后,选取合适的方法才能对故障类型准确分类。CNN(convolutional neural network,CNN)具有强大的非线性数据处理能力,可直接对信号进行特征提取。王琦等[10]利用1D-CNN网络中利用1×1卷积核增强1D-CNN的非线性表达能力,并将全连接层用全局平均池化层取代。NISHAT等[11]提出一种EEMN结合CNN的故障诊断方法。以上方法虽能取得较高的准确率,但是在实际的工程应用中不同型号、工况下的轴承存在一定差异,实际运行状态复杂多变,不能使用同一深度学习模型进行诊断。
迁移学习可以将在某个领域中训练到的模型应用到另一个不同但是相关的领域问题中,因此可以实现不同工况的故障诊断[12]。廖玉波等[13]以DBN为迁移框架对旋转机械进行迁移故障诊断,对没有标签的目标域数据进行分类识别。该方法中源域、目标域的模型差异仍然有提升的空间,且实现起来较为困难。张根保等[14]建立一种以稀疏自动编码器为框架的迁移故障诊断,将HKL散度用于域适应训练中。从以上文献可以看出,迁移学习技术主要以深度神经网络为架构,提取源域和目标域的特征,将源域分类损失进行优化的同时,对源域和目标域的分布进行约束。
基于此,本文提出一种基于改进粒子滤波和卷积神经网络的轴承迁移故障诊断方法。利用天牛须改进的粒子滤波进行降噪处理,对于不同工况下轴承故障识别复杂的问题,将深度学习与迁移学习相结合,在全连接层通过多层多核域适应的方法缩短源域和目标域的样本分布差异,完成轴承的故障诊断。
1.1 天牛须改进的粒子滤波算法
粒子滤波的主体思想是在状态空间种随机产生一组粒子模拟当前状态,近似系统随机变量的概率密度函数,递推对粒子的权重、位置来改变和更新,获得状态最小方差估计。但是当一个粒子的权重接近1而所有其他粒子的权重接近零时,传统粒子滤波算法容易发生粒子退化,进而影响粒子滤波的效果。
天牛须算法(beetle antennae search,BAS)是受天牛觅食行为启发提出的一种高效的智能优化算法[15]。BAS算法参数少,运算量小。
设在k维解空间中随机生成天牛个体的朝向,并作归一化处理。天牛左、右须的坐标为:
(1)
式中,t为当前迭代的次数;
xl、xr分别为左、右触角的坐标;
xt、dt分别为第t次迭代天牛的质心位置和两触角间的距离。
判断天牛左右须的气味强度,进而确定t+1时刻天牛质心位置。
xt+1=xt-δt*b*sign(f(xr)-f(xl))
(2)
式中,sign为符号函数;
f(·)为适应度函数;
fl和fr分别左右须感受到的气味强弱大小,即为适应度大小;
δt为第t次迭代的移动步长。
更新左右两须的距离和步长:
(3)
式中,ηd、ηδ分别为距离d和步长δ的衰减系数,通常δt=α*δt-1;
α为步长因子,一般情况下取0.95。
针对粒子多样性匮乏问题,本文采用BAS对PF重要性采样进行优化,以此提高PF的性能。将天牛看成粒子滤波中的粒子,模拟天牛寻找食物过程,天牛不断地更新自己的位置并向适应度最高的最优位置区域的移动,使粒子不断地逼近真实系统状态的后验概率的高似然区,提高粒子分布合理性。
将最新量测值引入采样中,定义适应度函数为:
(4)
式中,Rk为观测噪声方差;
yt、yperd分别为当前观测值和预测观测值。f值越大说明天牛所处的位置越好,粒子离真实最优位置越近。
1.2 改进粒子滤波的模拟信号仿真研究
采用一维非线性非高斯经典模型来验证不同参数下PF与BAS-PF的有效性并进行对比分析,其状态方程和观测方程为:
(5)
式中,x(t)为状态值;
y(t)为量测值;
系统噪声、观测噪声u(t)、v(t)均是0均值噪声,服从u(t)~N(0,5),观测噪声v(t)~N(0,1),初始状态x0=0.1,仿真时间t=100。天牛须参数:初始步长为10,迭代次数n=50;
α=0.95,按比例缩小步长。
以RMSE作为算法稳定性判断的依据,RMSE越小准确率越高。粒子数量分别取100、200、500,最终平均结果为10次运行的平均值。基本PF和BAS-PF的对比如表1所示。
表1 粒子数量不同时RMSE结果对比
可以看出,BAS-PF的均方根误差总明显小于PF的值。随着粒子数量增多,两种方法的均方根误差值随之变小,粒子数量增加会使运算量大量提高,影响算法的时效性。本文方法在粒子数量为100时就有较高的精度,说明了本文算法的准确性。标准PF由于在运算时舍弃大量权重低的粒子,粒子的多样性低,而BAS-PF可以驱使粒子向后验概率高似然区移动,通过不断调整粒子的位置使粒子分布更加合理,改善了粒子权值退化,降低了估计值与真实值之间的误差。
以N=500为例,PF与BAS-PF的误差绝对值对比如图1所示。
图1 误差绝对值对比
可以看出,PF依然在一些点存在着极大的误差,BAS-PF只有3个点的误差较大,其他采样点的误差相对较小。实验结果表明,BAS-PF在信号重构比PF具有更高的准确率。
2.1 注意力机制原理
卷积神经网络通过多次卷积、池化,可获取数据深层特征。但是随着网络的运行,可能会发生过拟合现象,影响后续训练分类的准确率。
为了增强对有效信息的利用率,可以在网络中添加注意力机制(attention mechanism,AM)结构,其核心是寻找网络中最重要的一部分信息进行处理,增加对有效信息的利用率[16]。本文采用注意力机制中的通道注意力机制(squeezeand excitation Net,SE Net),增强通道之间的依赖关系。
各通道首先执行最大池化和平均池化过程,再输入到MPL感知器中处理变换,分别应用于两个通道中,最后进行元素求和。
因轴承的故障振动信号具有局部突变性的特点,将注意力机制的思想引入到CNN网络结构获取大量特征后,利用SE建立网络中各通道间特征的映射联系,可增强有用的特征,实现对轴承故障特征的准确提取,将网络模型的特征识别性能提高。
2.2 基于多核最大均值差异的领域自适应
领域自适应可通过增强两个域之间的关联性,使用带有标签的源域对不带标签的目标域数据进行分类。一般通过缩小源域和目标域的距离,使两域共享子空间,惯用手段如MMD、KL散度、布雷格曼散度。
最大均值差异(MMD)对样本的两个概率分布差异进行评估,是一种核学习方法[17]。xs、xt利用核学习映射到希尔伯特空间,减少两域的边缘概率分布差异性,计算公式为:
(6)
式中,xs、xt分别为源域和目标域的样本域;
φ为RKHS中xs、xt的一个非线性映射函数;
k(·)为高斯核函数。
(7)
式中,σ为核函数的带宽。
MMD值越大,两域间的数据分布差异性越大。采用多核最大均值差异(multi kernel-maximum mean discrepancies,MK-MMD)测量相关域的分布差异,使得两域在希尔伯特空间的距离最小化。MK-MMD即在原MMD的基础上用多个不同的高斯核函数构造一个总和k,计算方式是用不同的σ计算MMD的距离和总核K的定义为:
(8)
式中,βu为多核的权重系数。
在两个工况不同的域中,故障诊断的任务是相同的,即分类的类别是相同的。由于源域标签已知的,可以通过最小化训练样本的分类误差。利用交叉熵损失函数,结合MK-MMD进行约束构建损失函数。损失函数公式为:
(9)
式中,θ为网络中参数;
n为批量样本数量;
Dk为MK-MMD的大小;
J(·)为交叉熵函数;
λ为MK-MMD的权重。
以1D-CNN为架构,构建故障分类模型,整体结构如图2所示,整体架构由数据处理、包括特征提取和领域自适应3部分构成。
图2 故障诊断网络
本文采用重叠采样技术对数据进行扩充处理,以此提高样本数据的数量。为了提升网络的性能,在网络中添加Dropout机制。利用BN技术对除了输出层的卷积层及全连接层隐含层进行优化处理,加快模型的训练过程,减少梯度弥散的发生,增强网络模型的泛化能力。
输入的轴承信号首先经过BAS-PF和数据增强技术,得到一系列较为纯净的轴承信号。通过加入注意力机制的CNN模型实现特征提取。在每一层网络后添加注意力机制结构,通过逐层通道注意力机制获取更具判别性的故障特征。领域自适应迁移诊断网络通过在源域和目标域之间使用MK-MMD,通过多层领域适配,减小迁移特征的分布差异,使学习的特征具有域差异最小化的特点,本文在全连接层实现域适应。具体操作如下:
(1)预处理:首先利用改进的粒子滤波算法处理原始轴承信号,然后利用重叠采样处理降噪后的振动信号,扩充其样本的数量;
(2)将源域、目标域同时输入到网络中,进行加入注意力机制的卷积池化操作,提取高级故障特征;
(3)源域数据与目标数据通过MK-MMD多层适配,构建MK-MMD与交叉熵损失函数组合的损失函数;
(4)输到softmax分类器中,得到故障分类结果。
训练结束,CNN可以有效地获得源域数据对应健康状态之间的关系,同时可以通过域自适应最小化任务特定层中的分布差异。因此,可以获得领域不变特征,并从相关但是不同的目标域中获得不同工况下相对满意的特征。
4.1 实验数据介绍
本文采用(CWRU)轴承数据集验证提出方法的有效性。故障数据由内圈、外圈和滚动体故障组成,损伤直径分别为:0.007 mm、0.014 mm、0.021 mm,每种转速下共有10类轴承信号,轴承故障信息如表2所示。
表2 轴承故障信息
4.2 改进粒子滤波的轴承降噪研究
针对实际轴承信号,根据轴承的状态空间描述,利用自回归滑动平均模型建立轴承振动信号的离散状态空间模型,获得状态方程和观测方程。本文采用最终预报误差准则对轴承状态空间模型定阶。
轴承阶数定位4阶,以工况为轴承内圈故障直径0.007 mm为例,降噪实验结果如图3所示。
图3 降噪实验结果
经过BAS-PF处理后的信号有了一定的改善,处理后信号峰值明显变小,说明BAS-PF对于轴承振动信号的降噪具有一定的有效性。
4.3 轴承故障诊断实验
利用4.2节处理后的数据,根据上一章中的网络模型进行轴承变工况故障诊断实验。设计6个迁移任务,选取表中一类工况作为源域数据,目标域为另一不同转速下数据。经过重采样数据扩充处理后,每784个数据点作为一个样本,每种转速下有4000个样本,每一工况10种类别,每类状态有400样本数据。训练集选取带标签的源域数据和80%的无标签目标域数据,在测试阶段用无标签目标域剩余无标签数据验证网络的分类性能。
为了验证本文方法的有效性,在相同的CNN结构下用同一数据集选用以下方法进行对比分析。
方法一SE:加入注意力机制的无迁移CNN网络,用有标记的源域进行训练,然后之间用于目标域样本进行测试;
方法二DAN:加入单层MMD的域适应迁移网络,其中FC3层网络学习到的特征用于域自适应;
方法三SEDAN:加入注意力机制和单层MMD的域自适应迁移网络,用FC3层网络学习到的特征用于域自适应,取k=2,λ=0.1。
CNN网络初始化参数为:学习率0.001,BatchSize批量大小100,迭代次数40次。选择不同的负载,采用以上方法进行迁移分类。
以A→B为例,本文方法在A→B的迁移任务中混淆矩阵、准确率、损失函数曲线,如图4、图5所示。比较方法的结果对比如表3所示。
图4 混淆矩阵 图5 准确率曲线
表3 分类结果对比 (%)
从图4可以看出,在迁移任务中,一种类型的轴承特征几乎都能被很好的识别,所有类型的准确率都大于90%;
从图5中可以看出,在训练初始阶段误差较高,随后迭代次数增加,准确率急剧提升,最终趋于平稳,说明此时两域分布差异性达到理想化的目标,同时说明说明该方法有较强的学习能力。
从表3可以看出,加SE的多层MK-MMD网络在几种方法中准确率最高,具有较强的学习能力,更适用于轴承的故障迁移诊断,能够对数据进行有效处理,适应性更强,最终平均准确率为98.53%;
与不加迁移的CNN相比,加入域适应的迁移网络准确率明显更高,都取得了比较好的分类结果;
由于方法三、四仅仅只用了单层域适应估计源域和目标域之间分布差异性,而SE+MK-MMD利用两层域适应网络更能拉近两域希尔伯特空间的距离,学习到更多特征,可以使网络的迁移学习能力更强。
为了进一步证明所提方法的性能,更直观的解释本文方法在不同工况下分类性能优于其他诊断方法的原因,利用T-分布式随机领域嵌入法(t-distribution stochastic neighbor embedding,T-SNE)进行降维处理,对网络进行可视化分析。以A→B为例,各个方法的T-SNE特征分布图如图6所示。
(a) 方法一 (b) 方法二
从图6a可以看出不加入迁移学习的CNN网络无法学习到有效特征,无法对故障特征进行有效分离,特征大量重叠在一起;
加入迁移学习后,不同状态下轴承的故障特征不会大量重叠在一起,从图6b和图6c中可以看出,加入域适应的迁移网络能够减小源域和目标域的分布差异性,可将不同种类的特征大致区分,与前两种方法相比,分类性能在一定程度上有所改善。对比其他几种方法,图6d能更好的分离故障特征,通过多层域适配进一步缩小了两域分布的差异性,证明本文方法能够将训练好的源域模型直接应用到目标域中进行训练。
本文以轴承为研究目标,基于粒子滤波和深度学习针对多工况下的轴承故障进行研究,提出了一种用天牛须改进的粒子滤波子和域适应卷积神经网络的轴承故障诊断方法。实验结果表明:
(1)相比于标准PF,本文提出的BAS-PF的稳定性和准确性更好,能够对轴承原始信号进行有效处理。
(2)本文采用1D-CNN为框架迁移学习模型,通过添加注意力机制模块对轴承故障特征进行有效利用提升网络的性能,并在全连接层添加MK-MMD缩短两域分布差异,进行变工况轴承故障诊断时,能够有效识别轴承的各类状态,具有很强的可靠性。
猜你喜欢源域天牛故障诊断基于包络解调原理的低转速滚动轴承故障诊断一重技术(2021年5期)2022-01-18天牛到底有多牛小哥白尼(野生动物)(2021年1期)2021-07-16基于参数字典的多源域自适应学习算法计算机技术与发展(2020年11期)2020-12-04黑黄花天牛小学生必读(低年级版)(2018年10期)2019-01-04巨型昆虫——天牛故事作文·低年级(2018年10期)2018-10-25数控机床电气系统的故障诊断与维修电子制作(2018年10期)2018-08-04因果图定性分析法及其在故障诊断中的应用重庆工商大学学报(自然科学版)(2015年10期)2015-12-28可迁移测度准则下的协变量偏移修正多源集成方法电子与信息学报(2015年12期)2015-08-17天牛作文与考试·小学低年级版(2015年11期)2015-07-17基于LCD和排列熵的滚动轴承故障诊断振动、测试与诊断(2014年5期)2014-03-01