基于深度学习的管道漏磁异常数据识别方法(第一部分)
摘要
管道漏磁内检测技术在长输油气管道的探伤领域发挥着重要作用。在实际运行中,管道内检测器采集到的数据不可避免地会掺杂异常数据,对异常数据的识别将是准确评估管道性能的重要依据之一,也是判断检测设备是否正常工作的关键依据。针对检测数据量庞大、传统人工判读效率低、难以满足当前工业需求的现状,提出了一种基于一维卷积神经网络(1D-CNN)的轻量化管道漏磁异常数据识别方法;分别将采集的漏磁数据沿径向、轴向、周向上分割成多个采样点子序列,以漏磁数据的异常情况作为标签建立数据集。直接将一维信号作为模型输入,利用卷积神经网络(Convolutional Neural Network,CNN)自动提取漏磁异常数据特征信息,引入批量归一化层(BatchNorm)和优化Dropout正则化方法对模型进行迭代训练和评估,实现对漏磁检测数据异常的识别。结果表明:该方法具有较高的识别精度,在Dropout比率为0.3时,召回率、精度、准确率均可达到96%以上,具备批量处理数据的优势,可应用于对管道漏磁数据异常情况的识别。基于深度学习的管道漏磁异常数据识别方法提供了一种异常数据高效识别的解决方案,能够充分挖掘漏磁数据的重要特征,实验结果进一步证实了该模型的准确性及有效性,具有广阔的应用前景。
长输油气管道敷设在复杂的自然环境之中,受施工损伤、电化学腐蚀、地质灾害等外界因素的影响,容易发生泄漏事故,为了降低管道运行风险,应进行定期检测。漏磁内检测技术是目前应用最广的检测技术手段。在管道漏磁数据采集过程中,受到周围环境以及检测装置故障等因素的影响(如传感器损坏、线路接触不良等),导致采集到的漏磁数据中掺杂着异常数据。这些异常数据不仅无法反映出管道的真实情况,还会对管道中的正常数据造成干扰,进而直接影响对整个管道性能的评估。为此,管道漏磁异常数据的识别对数据分析处理至关重要。
Aljameel等使用机器学习算法,比较了随机森林等6种模型对异常点的识别能力。Chen等提出单类支持向量机(OCSVM)算法,通过学习输油管道的正常样本,筛选出真正的管道泄漏异常。曹辉等针对漏磁内检测中由于噪声的存在使得异常边缘不清晰,提出了一种基于数据融合的小波变换漏磁异常边缘检测算法。董泽等提出将信号分解方法与基于密度算法相结合的异常值检测方法,通过小波变换法提取以时间为序列的运行趋势,然后采用局部离群因子方法(LOF)求取异常值。新兴的深度学习算法为大数据的高效处理提供了新思路,特别是卷积神经网络(CNN),在图像分类与识别等领域表现出色。谭震和张瑞程等研究发现,CNN模型在管道检测中具有优异的分类性能,克服了传统反向传播(BP)神经网络预先提取数据特征信息的局限性,显著提升了检测的可靠性。Yuksel和崔国宁等分别提出了YOLOV5和CNN模型,实现对管道缺陷的识别和量化。Shen和Malashin等在管道腐蚀分类CNN模型中,引入Dropout正则化方法,提高模型的腐蚀检测能力。深度学习模型多数是将一维信号重塑为图像形式作为输入,对于一维信号CNN的强大特征提取能力并没有得到充分发挥,仍存在一定的人工干预。
本文提出一种用于油气管道漏磁异常数据识别的基于一维卷积神经网络的轻量化模型;将一维数据输入模型中,引入批量归一化层和优化Dropout正则化方法,提高模型的特征提取能力。在数据集的制作和模型参数优化上,充分结合漏磁数据的特征,以实现二者的更高适配性。通过实验分析与评估,建立漏磁异常数据识别模型,为后续的漏磁数据分析提供应用参考。
1. 管道漏磁内检测
1.1 漏磁内检测数据结构
管道漏磁内检测是通过管道内检测器外加磁场对管道进行磁化。如若管壁没有缺陷,则磁力线闭合于管壁之内;若在管壁上遇到缺陷,磁力线将穿出管壁而产生漏磁场。该漏磁场由检测器上紧贴管壁的探头检测,经由滤波等一系列处理,然后传送至计算机存储(图 1)。
主要储存数据包括径向、轴向、周向的漏磁数据和辅助信息,辅助信息主要包括里程、周围环境温度和管道相关配置文件信息。漏磁数据在列方向呈环形闭合、行方向近似无限延伸。
1.2 异常特征
1.2.1 正常数据
异常数据识别问题是一种二元分类问题,即将数据分为正常类和异常类。能够反映出管道真实情况的数据统称为正常数据,如常规数据、缺陷数据、焊缝数据和法兰数据等皆视为正常数据(图 2)。缺陷数据能够揭示管道存在的裂纹和腐蚀等信息;焊缝数据和法兰数据能够说明管道的组件信息。
1.2.2 异常数据
管道漏磁内检测过程中,采集的漏磁数据常混入无法有效表征管道实际状态的异常数据,常见的类型主要包括3种(图 3)。
异常平滑数据(图 3a)可能是由于管道周围环境温度变化和管道内物质的流速改变引起的,特征表现为连续采样点数据的幅值保持不变且严重偏离基值;奇异点数据(图 3b)特征表现为局部个别采样点数据出现显著的极大值或极小值;连续振动数据(图 3c)可能是由于传感器内部接触不良引起,表现为某一通道上连续序列采样点数据的幅值突然大幅度增加或减少,形成脉冲式振动剧烈的信号。
相比于正常数据的平滑且有规律,异常数据往往伴随着随机性与不规则性。同样随机性很强的缺陷数据与异常数据也大不相同。缺陷数据往往是相邻多通道具有相同的变化趋势,有较明显的波峰波谷,信号更平滑;异常数据则多发生在单一通道,且信号更突兀尖锐,出现范围更长。由于异常数据具有高度的不规则性,导致其种类繁多,因此本研究采用整体识别的方法对异常数据进行检测。
2. 一维卷积神经网络模型的建立
2.1 卷积神经网络
卷积神经网络是通过多层感知机(MLP)演变发展而来,是神经网络的变种。与传统的人工神经网络(ANN)不同,其能够将特征提取和分类任务合并到一个主体中,这种整合是显著提升分类性能的关键优势。卷积层自动获得输入的数据特征,通过层层堆叠的方式,逐步实现数据特征的学习,具有较强的并行处理能力与容错能力,能够充分实现对漏磁数据特征的学习。