2021/11/12

【技术】基于DTEmpower的旋转机械故障诊断


概述



旋转机械在各行业中应用广泛,其中许多设备在生产流程上都至关重要,一旦出现故障,会带来巨大的经济损失。加强对这类设备的监测诊断,对于提高设备的安全性和可靠性,降低运行维护成本具有非常重要的作用。旋转机械故障诊断方法大体分为以下3类,即基于物理模型的方法、基于信号处理的方法、基于数据驱动的方法:

1. 基于物理模型的方法主要是获取设备上的数据信号,并用最初建立的模型对数据处理结果进行分析,从而得到机组的故障诊断情况。但通常需要深入了解机器的工作机理,难以建立起现代复杂机械设备的精确物理系统,特别是在动态、噪音大的工作环境下。

2. 基于信号处理的方法通过信号处理实现信号降噪,旨在探索先进的信号去噪和滤波技术,突出故障特征信息。但特征频率的计算往往需要相关的设备知识,实体故障表征理论和数学基础是其前提。依赖专家进行诊断,可移植性较弱。

3. 基于数据驱动的方法,在不了解系统的学习和物理模型的情况下,仅利用检测到的状态监测信号结合历史数据或外来迁移数据,分析提取特征信息,对系统进行故障诊断和性能评估。该方法即不需要大量的领域专家知识和知识的表达式推理机制,也不需要建立精确的复杂系统模型,是当下智能诊断的研究热点。

DTEmpower是天洑软件通过对工业企业数据建模需求的深度挖掘而自主研发的一套针对工业用户的图形化数据建模平台。它围绕数据清理、特征提取、特征选择和模型训练等数据建模的各个环节,提供有大量算法,通过针对特定场景下算法的深度研发,利用智能调度引擎和超参优化等技术,提高模型质量的同时,降低了对用户数据建模经验的要求。DTEmpower针对旋转设备故障诊断有一套完备的智能诊断方案。


DTEmpower简介



DTEmpower 是一套针对工业用户的图形化数据建模平台,所有的数据及模型操作均以工具箱中模块的形式提供,用户无需具备编码能力,通过简单的节点拖拽与节点连接即可完成复杂的数据建模流程的构建。

图片1.png

图1  DTEmpower平台数据建模流程示例

DTEmpower 围绕数据清理、特征提取、特征选择和模型训练等数据建模的各个环节,在工具箱中以控件的形式提供了上百种常用算法和数种先进的自研算法:包括8 种数据采样算法、21 种数据清理算法、6 种数据聚类算法、15 种数据降维算法、6 种数据变换算法、5 种特征选择算法、11 种线性拟合算法、22 种非线性拟合算法、以及其他搭配控件。

图片2-1.png

图片2-2.png

图片2-3.png

图2 DTEmpower平台提供的数据建模算法示例

作为一个开放式的数据建模平台,DTEmpower提供了针对旋转机械设备故障诊断场景的定制工具箱,包含数据采集、特征提取和模式分类(故障识别)三大主功能。

数据采集主要对信号进行预处理。特征提取主要对振动信号进行特征加工,挖掘出能反应故障表征的特征量。对于模型而言,特征工程决定模型效果的上限,DTEmpower针对旋转设备诊断提供了丰富的特征提取功能。时域和频域分析方法在平稳信号的处理方面优势突出,而旋转机械由于磨损和削落等故障产生的振动信号具有强非线性和非平稳特性,这类信号中表征故障特征的时域和频域参数会随着时间和频率的变化而发生变化,时频分析方法能够分析信号局部特征的,可以对频谱随时间变化的特性进行有效分析。DTEmpower参考这些优秀的行业经验,提供了包括16种时域特征(如脉冲因子、裕度因子、峭度因子、波形因子偏度和峰峰值等)、13种频域特征(如重心频率、均方频率、频率方差等)、时频域特征(如小波能量等),其中时频域特征可以动态扩增对模型进行改进。

模式分类针对复杂的生产环境,提供了多套模型策略方案。旋转设备故障诊断当前遇到的最大的难点主要是现场样本不均衡,故障样本过少,甚至无样本情况,数据驱动的模型难以充分挖掘故障信息。针对健康数据和故障数据极端不平衡的问题,DTEmpower提供了丰富的数据增殖算法(如SMOTE、生成对抗网络等算法),搭配使用监督学习技术构建设备对象的故障类型判别器,对具体现场进行故障诊断;针对故障样本之间分布不均匀等问题,DTEmpower集成了智能训练算法 AIAgent,融合了多种采样及模型训练策略,使用集成算法提升模型精度和稳定性;同时,针对现场无故障样本学习的难点, DTEmpower平台了融合多种设备故障数据库,采用迁移学习技术(如CORAL、AdaBN、DAAN、DSN等算法),利用迁移学习在模型泛化方面的优点,为复杂机械系统的故障诊断与预测提供新的方法和手段。

DTEmpower故障诊断案例分析



使用东南大学和江南大学故障诊断数据集,基于DTEmpower平台完成数据建模和故障分类的应用。将原始数据以1000个为一组经过数据清理后进行小波能量特征变换,东南大学数据集中5个类别的样本数量均为1048;江南大学数据集中3种故障类别各含有1500个样本,正常类别含有4500个样本。

然后使用DTEmpower平台集成的随机森林(Random Forest, RF)、多层感知机(Multilayer Perceptron,MLP)、AdaBoost和梯度提升树(Gradient Boosting Decision Tree, GBDT)4种算法对各个数据集中的样本进行训练和测试。

图片3.png

图3 基于DTEmpower平台对故障诊断数据集的建模流程

DTEmpower软件平台不仅提供了图形化的数据建模解决方案,而且也可以对建模流程中的各个节点进行超参数配置,然后应用天洑自主研发的超参学习引擎TFAutoML,用于自动寻找最佳超参。

图片4-1.png

图片4-2.png

图片4-3.png

 图4 基于DTEmpower平台算法节点超参配置

使用DTEmpower软件平台,东南大学数据集在上述4种模型上的分类准确率都能达到99%以上。

表1.png

表1 东南大学数据集在4种模型上的准确率

与东南大学数据集相比,江南大学数据集在4种模型上的的分类准确率整体偏低,需要对该数据集进一步探索,以提高其分类准确率。

AlgorithmAccuracy
RF74.32%
AdaBoost85.69%
MLP86.14%
GBDT89.53%
表2 江南大学数据集在4种模型上的准确率

从两方面探索提高模型在江南大学数据集上分类准确率的方法:特征工程和智能训练。特征工程是通过DTEmpower平台特征提取的参数配置,增加样本的特征维数;由于正常类别的样本是其他故障类型样本数量的3倍,使用DTEmpower平台提供的AIAgent模块,实现针对小规模数据集的智能训练。

图片5.png

图5 DTEmpower平台的特征提取和智能训练

利用AIAgent模型对新样本训练测试,分类准确率可以提高到99%以上。


准确率准确率提升
原始数据89.53%0%
增加特征维数93.87%+4.34%
智能训练98.57%+9.04%
增加特征维数和智能训练99.26%+9.73%

表3 江南大学数据集经过特征工程和智能训练后的准确率

对江南大学数据集进行进一步挖掘,数据集有三个不同工况,分别是转速600、转速800和转速1000。采用AdaBN迁移学习算法分析不同工况下故障识别率,模型训练中以一个工况作为训练集,另一个工况作为测试集,对特征权重进行迭代修正,实现泛化的目的。实验结果如表4所示,可以看出对于无标签的变工况诊断,模型仍具有较高的分类识别率。

表4.png

表4 江南大学数据集不同工况迁移学习预测准确率


总结



DTEmpower针对有标签、无标签及样本不均衡等不同场景下的故障诊断均具有很好的诊断效果,为客户提供了使用简单、功能强大的实验平台,提供特征提取、特征选择和模型训练一站式的数据建模解决方案。