1.本发明涉及高速列车的踏面缺陷检测技术领域,更具体地,涉及一种基于卷积神经网络的列车轮对踏面损伤识别模型及方法。
背景技术:2.轮对作为列车重要的支撑和走形部件,在长期轮轨滚动接触过程中会引起踏面磨耗、裂纹等故障,给列车安全运行带来了隐患。现有基于人工经验的识别方式存在故障识别延迟、基于车载传感信息的数据驱动方式又难以实现环境噪声与有用信息的有效隔离,导致故障识别率低等问题。因此实现轮对踏面故障的精确检测,可为列车轮对“状态修”提供关键依据,对列车安全运行具有重要意义。
3.轮对踏面路状态监测是保证铁路运输系统安全运行的重要任务之一。基于深度卷积网络的轮对踏面识别模型旨在尝试获得具有区别性和鲁棒性轮对踏面特征。如cn201910178267.2一种基于深度卷积神经网络的列车轮对踏面损伤故障诊断方法公开首先将列车实时采集的踏面轮对踏面图片进行图像预处理,利用基于tensorflow平台下的inceptionv3算法对已经预处理的数据进行特征提取,然后将提取的特征输入softmax分类器进行踏面损伤程度分类,为后续列车的分级控制提供依据。
4.除了特征学习外,还利用模型融合的方式去提升模型的性能。cn202111051260.8基于目标检测算法的列车轮对踏面缺陷检测方法及系统公开通过cdarknet53主干特征提取网络和spp对输入样本进行多尺度特征提取;其次提出的多尺度特征融合对底层特征进行一次融合,将特征融合输出不同分辨率大小的一次融合特征,可以包含缺陷更多的语义信息和位置细节;基于这些多尺度融合特征,采用路径聚合网络对不同分辨率大小的特征图进行二次融合;最后辅以改进的损失函数,提高抗干扰性,输出检测结果。该专利通过多尺度特征融合,解决了干扰、噪音背景影响故障特征的有效提取。但是,该方法是旨在提升单一特征提取模块的特征提取能力,或者是集成多个特征提取器来达到更高的模型性能,该方法并没有一个具有局部决策能力的决策模块对踏面的故障进行决策,从而在模型训练速度上具有一定的劣势。
技术实现要素:5.本发明要解决的技术问题是针对现有高速列车轮对踏面缺陷检测模型中,缺少局部决策能力导致模型训练速度慢、故障识别精度低的不足,提供基于卷积神经网络的列车轮对踏面损伤识别模型。
6.本发明还提供基于卷积神经网络的列车轮对踏面损伤识别方法。
7.本发明的目的通过以下技术方案予以实现:
8.一种基于卷积神经网络的列车轮对踏面损伤识别模型,包括数据收集和预处理模块、特征提取模块和脊柱网络神经模块;所述数据收集和预处理模块收集踏面损伤图像数据,并对图像数据进行尺寸裁剪、增强和筛选;特征提取模块通过卷积核降低数据收集和预
处理模块处理后的图像数据的维度,提取出有效的特征;所述脊柱网络神经模块接受来自特征提取模块的特征数据,通过全连接层得到最终的输入结果。本发明首先利用特征提取模块快速提取轮对踏面故障数据特征,然后利用具有逐步输入的脊柱神经网络深度网络作为网络的全连接层函数,实现轮对踏面故障的快速决策。
9.进一步地,所述特征提取模块采用mobilenet网络结构,具有较小的模型空间复杂性,能够减少模型的控件复杂度,使其能够在移动设备和计算能力较低的计算机上工作。
10.进一步地,所述脊柱网络神经模块采用spinal-net决策模块,它将一般卷积神经网络的全连接层改成具有局部决断能力的多个部分spinal-net决策模块,起着承上启下的作用,包括输入层、中间层和输出层,输入层接受来自特征提取模块的特征数据,中间层进行局部决断后由输出层得到最终的输出结果。
11.进一步地,所述spinal-net决策模块的中间层中设有隐藏层,隐藏层包括了dropout层、linear层和relu激活层。网络神经模块的本质一个多层复合函数,为了提高网络的拟合能力,减少梯度消失现象,需要引入激活函数来保证神经网络的非线性。本发明的局部决策模型中,所述relu激活层的激活函数作为决策模块的重要组成部分,对神经网络的响应纠正起着重要作用,有利于加快训练过程,提高分类性能。
12.进一步地,所述relu激活层使用leaky-relu激活函数、prelu激活函数或rrelu激活函数的一种,相较于常规脊柱神经网络使用的relu激活函数,leaky-relu激活函数及其变体的prelu激活函数或rrelu激活函数在本发明较小的踏面数据集中更加适用。
13.所述的spinal-net决策模块采用局部输入以及局部决断的方式,因此网络模型只接受一部分特征,这一部分特征可能包含对决策有重要意义的信息,使得网络模型可能会作出提前决策的功能。这样一来就可以能有效的避免干扰信息的影响,加快了网络的收敛速度,显著减少网络识别偏差。解决了踏面图片特征提取模块带来的干扰大这一问题。
14.一种基于卷积神经网络的列车轮对踏面损伤识别方法,步骤包括:
15.s1.根据现场采集的数据,将轮对踏面损伤数据集分成缺陷样本与正常样本,对数据采取裁剪、归一化、随机翻转的数据预处理操作;
16.s2.将预处理后的轮对踏面数据集按照批次输入到深度可分离卷积、残差模块和最大池化层得到和脊柱神经网络输入层相适配的高维特征图。
17.s3:将所得的高维特征图拆分成两部分送入脊柱神经网络输入层,将拆分后的部分输入以及输入层的输出叠加后同时输入到输出层,通过局部的输入得到局部的诊断结果,使得每一层中间层都对最终的输出结果起影响,最终结合每一层中间层的结果得到最终的诊断结果。
18.进一步地,所述数据预处理包括尺寸剪裁、数据增强、数据筛选和数据标准化。
19.进一步地,所述尺寸剪裁的作用是适应神经网络结构,神经网络可接受的数据尺寸是固定的,通过尺寸剪裁的操作使得数据成为神经网络可读取的格式。
20.进一步地,所述数据增强的作用是为了增加样本的多样性使得训练后的模型具有更好的鲁棒性。
21.进一步地,所述数据筛选的作用是剔除掉偏离样本分布的数据。
22.进一步地,所述数据标准化处理是为了获得相同规格的训练数据。
23.进一步地,步骤s2所述深度可分离卷积包括深度卷积和逐点卷积,分别对输入特
征图的通道和像素点进行卷积操作,通过卷积核降低图像数据的维度,提取或整理出有效的特征。
24.进一步地,所述深度卷积的计算式为:
25.dk×dk
×n×dg
×dg
26.其中,dk表示输入特征图的宽和高,n是输入的通道数,dg为输出特征图的宽和高。
27.进一步地,所述深度可分离卷积的计算为
28.dk×dk
×
n+dg×dg
×m29.其中,dk表示输入特征图的宽和高,n是输入的通道数,dg为输出特征图的宽和高,m是输出的通道数。
30.相较于标准卷积,mobilenet网络结构使用3x3的深度可分离卷积少了8到9倍的计算量,并且只损失了极少的准确率。
31.与现有技术相比,有益效果是:
32.本发明通过在训练过程中嵌入spinal-net的局部推断策略,对特征图进行局部的输入,该网络参考人类脊椎系统处理信息的方式,创新性的对特征图进行局部的输入,使得网络具有渐进推断的能力,能有效的避免干扰信息的影响,加快了网络的收敛速度,显著减少网络识别偏差,可以应用于解决轮对踏面图片特征提取模块带来的干扰大的问题。并设计的具有新的激活模块的mobilenet-s-l模型,通过改进版的spinal-net的局部推断策略训练,以确保模型在利用强大的特征提取模块之后还能挖掘决策模块的潜力。
附图说明
33.图1为基于卷积神经网络的列车轮对踏面损伤识别模型结构框图;
34.图2为spinal-net决策模块结构示意图;
35.图3为激活函数的准确率示意图;
36.图4为激活函数的损失值示意图。
具体实施方式
37.下面结合实施例进一步解释和阐明,但具体实施例并不对本发明有任何形式的限定。若未特别指明,实施例中所用的方法和设备为本领常规方法和设备。
38.实施例1
39.本实施例提供一种基于卷积神经网络的列车轮对踏面损伤识别模型。
40.如图1-2所示,所述基于卷积神经网络的列车轮对踏面损伤识别模型包括数据收集和预处理模块、特征提取模块和脊柱网络神经模块。本发明首先利用特征提取模块快速提取轮对踏面故障数据特征,然后利用具有逐步输入的脊柱神经网络深度网络作为网络的全连接层函数,实现轮对踏面故障的快速决策。
41.所述数据收集和预处理模块收集踏面损伤图像数据,并对图像数据进行尺寸剪裁、数据增强、数据筛选和数据标准化的预处理。所述尺寸剪裁的作用是适应神经网络结构,神经网络可接受的数据尺寸是固定的,通过尺寸剪裁的操作使得数据成为神经网络可读取的格式。数据增强的作用是为了增加样本的多样性使得训练后的模型具有更好的鲁棒性。数据筛选的作用是剔除掉偏离样本分布的数据。数据标准化处理是为了获得相同规格
的训练数据。
42.所述特征提取模块采用mobilenet网络结构,通过卷积核降低数据收集和预处理模块处理后的图像数据的维度,提取出有效的特征;
43.所述脊柱网络神经模块接受来自特征提取模块的特征数据,设有spinal-net决策模块,包括输入层、中间层和输出层,输入层接受来自特征提取模块的特征数据,中间层进行局部决断后由输出层得到最终的输出结果。所述spinal-net决策模块的中间层中设有隐藏层,隐藏层包括了dropout层、linear层和relu激活层,所述relu激活层提高网络的拟合能力,减少梯度消失现象。
44.所述spinal-net决策模块采用局部输入以及局部决断的方式,因此网络模型只接受一部分特征,这一部分特征可能包含对决策有重要意义的信息,使得网络模型可能会作出提前决策的功能。这样一来就可以能有效的避免干扰信息的影响,加快了网络的收敛速度,显著减少网络识别偏差。解决了踏面图片特征提取模块带来的干扰大这一问题。
45.实施例2
46.本实施例基于实施例1所述的模型提供一种基于卷积神经网络的列车轮对踏面损伤识别方法,步骤包括:
47.s1.根据现场采集的数据,将轮对踏面损伤数据集分成缺陷样本与正常样本,对数据采取裁剪、归一化、随机翻转的数据预处理操作;
48.s2.将预处理后的轮对踏面数据集按照批次输入到深度可分离卷积、残差模块和最大池化层得到和脊柱神经网络输入层相适配的高维特征图。
49.s3:将所得的高维特征图拆分成两部分送入脊柱神经网络输入层,将拆分后的部分输入以及输入层的输出叠加后同时输入到输出层,通过局部的输入得到局部的诊断结果,使得每一层中间层都对最终的输出结果起影响,最终结合每一层中间层的结果得到最终的诊断结果。
50.实验例1
51.本实施例使用真实的轮对踏面损伤数据,为某车辆段车辆检修现场的轮对踏面相关数据,数据采集如图所示,共采集了损伤样本和无损伤样本共400张样本,并针对部分特定损伤类型自建小型数据集。并采用了数据增强策略来扩大训练数据集,所使用的数据集构成如表1所示:
52.表1
53.数据集损伤样本无损伤样本总计训练58069649测试41561476总计9951301125
54.采用relu函数作为激活函数,减少过拟合现象;为了控制网络的学习率,使用sgd(随机梯度下降)优化算法更新网络参数,学习率设置为0.01;在全连接层引入dropout正则化方法,避免过度拟合训练数据,速率为0.5。神经网络训练参数设置为:最大迭代次数epoch=50,小批量大小batchsize=32,训练方式:gpu。
55.选取残差神经网络(resnet)和密集卷积网络(densenet)作为对比,本方法的模型识别效果和效率如表2所示:
56.表2
57.模型名字准确率(%)参数大小(kb)训练时间(次)densenet96.003058689resnet-5091.209394690本发明98.71714450
58.由表2得知,本发明提出的列车轮对踏面故障诊断模型方法准确率可达98.7%,相较于densenet提高了2.7%,相较于resnet-50提升了7.5%。模型参数量仅为17144kb,约为densenet的50%,是resnet-50的30%。训练时间为50轮,是densenet的43.8%,是resnet-50的44%。由此可见,本发明极大的提升了故障诊断的效率和准确率缩短了训练所需要的迭代次数。
59.实验例2
60.本实验例在实施例1的模型上,分别采用prelu、erelu、relu和leakyrelu作为脊柱神经网络的激活函数,按照实施例2所述方法得到激活函数对准确率和损失值影响,如表3和图3和图4所示:
61.表3
62.激活函数准确率(%)收敛回合数prelu98.533erelu98.543relu98.544leakyrelu98.750
63.如图3所示,模型在迭代0到10次时,模型准确度没有变化,说明模型此时还不能区分缺陷与非缺陷数据。模型倾向于将所有的图像识别为数量多的类别,这就是模型产生了过拟合的问题。而随着迭代次数的增加,在10到25次迭代区间内模型的准确度快速的提升。说明模型学习到了能够区分缺陷数据与非缺陷数据的特征。当模型迭代到50轮时,精度提升减慢,说明以接近模型的最大拟合能力。模型处于收敛的状态。
64.如图4所示,损失值也随着模型的迭代次数不断降低,总体趋势和准确率相同。在准确率快速上升的区间,损失值也快速的下降,最终趋于平缓。
65.当选择relu激活函数时,mobilenet-s-r模型的故障识别准确率仅为98.5%,且其收敛速度相对较慢。当选择不同激活函数时,模型识别准确率略微上升,且准确率收敛速度也迅速加快,表明对脊柱神经网络激活模块选择不同的函数对故障类别的区分效果具有一定的提升。当选择leakyrelu激活函数时,其准确率上升到98.7%,以几乎能够识别所有的类别。
66.显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
技术特征:1.一种基于卷积神经网络的列车轮对踏面损伤识别模型,其特征在于,包括数据收集和预处理模块、特征提取模块和脊柱网络神经模块;所述数据收集和预处理模块收集踏面损伤图像数据,并对图像数据进行预处理;特征提取模块通过卷积核降低数据收集和预处理模块处理后的图像数据的维度,提取出有效的特征;所述脊柱网络神经模块接受来自特征提取模块的特征数据,通过全连接层得到最终的输入结果。2.根据权利要求1所述基于卷积神经网络的列车轮对踏面损伤识别模型,其特征在于,所述特征提取模块采用mobilenet网络结构。3.根据权利要求1所述基于卷积神经网络的列车轮对踏面损伤识别模型,其特征在于,所述脊柱网络神经模块采用spinal-net决策模块,包括输入层、中间层和输出层,输入层接受来自特征提取模块的特征数据,中间层进行局部决断后由输出层得到最终的输出结果。4.根据权利要求1所述基于卷积神经网络的列车轮对踏面损伤识别模型,其特征在于,所述spinal-net决策模块的中间层中设有隐藏层,隐藏层包括了dropout层、linear层和relu激活层。5.根据权利要求4所述基于卷积神经网络的列车轮对踏面损伤识别模型,其特征在于,所述relu激活层使用leaky-relu激活函数、prelu激活函数或rrelu激活函数的一种。6.一种基于卷积神经网络的列车轮对踏面损伤识别方法,其特征在于,步骤包括:s1.根据现场采集的数据,将轮对踏面损伤数据集分成缺陷样本与正常样本,对数据采取裁剪、归一化、随机翻转的数据预处理;s2.将s1处理后的轮对踏面数据集按照批次输入到深度可分离卷积、残差模块和最大池化层得到和脊柱神经网络输入层相适配的高维特征图;s3.将所得的高维特征图拆分成两部分送入脊柱神经网络输入层,将拆分后的部分输入以及输入层的输出叠加后同时输入到输出层,通过局部的输入得到局部的诊断结果,使得每一层中间层都对最终的输出结果起影响,最终结合每一层中间层的结果得到最终的诊断结果。7.根据权利要求6所述基于卷积神经网络的列车轮对踏面损伤识别方法,其特征在于,步骤s1所述数据预处理包括尺寸剪裁、数据增强、数据筛选和数据标准化。8.根据权利要求6所述基于卷积神经网络的列车轮对踏面损伤识别方法,其特征在于,步骤s2所述深度可分离卷积包括深度卷积和逐点卷积。9.根据权利要求6所述基于卷积神经网络的列车轮对踏面损伤识别方法,其特征在于,所述深度卷积的计算式为:d
k
×
d
k
×
n
×
d
g
×
d
g
其中,d
k
表示输入特征图的宽和高,n是输入的通道数,d
g
为输出特征图的宽和高。10.根据权利要求6所述基于卷积神经网络的列车轮对踏面损伤识别方法,其特征在于,所述深度可分离卷积的计算为d
k
×
d
k
×
n+d
g
×
d
g
×
m其中,d
k
表示输入特征图的宽和高,n是输入的通道数,d
g
为输出特征图的宽和高,m是输出的通道数。
技术总结本发明公开了一种基于卷积神经网络的列车轮对踏面损伤识别模型及方法,所述模型包括数据收集和预处理模块、特征提取模块和脊柱网络神经模块,利用MobileNet轻量级网络快速提取轮对踏面故障数据特征,然后利用具有逐步输入的脊柱神经网络深度网络作为网络的全连接层函数,实现轮对踏面故障的决策。本发明通过Spinal-Net的局部推断策略对特征图进行局部的输入,使得网络具有渐进推断的能力,能有效的避免干扰信息的影响,加快了网络的收敛速度,减少网络识别偏差。减少网络识别偏差。减少网络识别偏差。
技术研发人员:刘建华 刘佳豪 张昌凡 李哲姝 何静 黄刚 王忠美 贾林
受保护的技术使用者:湖南工业大学
技术研发日:2022.07.05
技术公布日:2022/11/1