本发明涉及高炉炼铁过程故障诊断领域,特别涉及一种基于鲁棒半监督分类框架的高炉炼铁过程故障诊断方法。
背景技术:
1、高炉炼铁过程是钢铁生产的核心环节。通过高炉炼铁,铁矿石在高温下与焦炭发生还原反应,生成生铁,这是钢铁制造的基础。高炉炼铁的效率和质量直接影响钢铁产品的成本和性能,因此其在钢铁工业中的地位至关重要。然而,高炉炼铁过程极其复杂,涉及多种物理和化学反应,需要在高温、高压环境下进行。这一过程对原料成分、温度控制、气流分布、设备状况等要求严格,任何环节出现问题都可能导致故障发生,影响生产的连续性和稳定性。有效的故障诊断可以提前发现潜在问题,避免生产中断,降低设备损耗,减少经济损失。
2、高炉炼铁过程中故障事件相对少见,导致标记故障数据(即已知故障的实例)十分有限,而正常运行的数据则相对丰富。这种数据不平衡给故障诊断模型的训练带来了巨大挑战。传统的有监督学习方法依赖大量标记数据,当标记数据不足时,模型难以有效学习和捕捉故障模式,容易出现过拟合问题。高炉炼铁过程中的故障模式多样且复杂,故障原因可能涉及多个参数的交互作用。要构建一个准确的故障诊断模型,需全面考虑各种可能的故障模式,这对模型的设计和训练提出了高要求。高炉炼铁过程需要连续运行,任何停机都会造成巨大的经济损失。因此,故障诊断模型不仅要准确,还需具备实时性,能够在故障发生的早期阶段及时检测并发出警报,避免故障进一步恶化。
3、传统的故障诊断多采用有监督学习方法,这些方法需要大量的标记数据进行训练,如支持向量机(svm)、随机森林(rf)、人工神经网络(ann)等。然而,在实际应用中,标记故障数据稀缺,导致这些方法难以有效应用。此外,有监督学习方法在面对数据分布变化时鲁棒性较差,难以适应高炉炼铁过程中复杂多变的工况。无监督学习方法利用未标记数据进行训练,如聚类分析、主成分分析(pca)、孤立森林(isolation forest)等。这些方法虽然可以在没有标记数据的情况下进行异常检测,但缺乏明确的故障模式识别能力,难以提供具体的故障原因和类型,诊断结果的可解释性较差。半监督学习方法尝试结合有监督和无监督学习的优势,利用少量标记数据和大量未标记数据进行模型训练。然而,现有的半监督学习方法在处理标记数据和未标记数据不平衡时仍存在性能瓶颈,未能充分利用未标记数据中的潜在信息,提高模型的诊断能力和鲁棒性。
技术实现思路
1、为了克服现有技术的不足,本发明的目的在于提供一种基于鲁棒半监督分类框架(rscf)的高炉炼铁过程故障诊断方法。
2、本发明实现其技术目的的技术方案如下:
3、一种基于鲁棒半监督分类框架(rscf)的高炉炼铁过程故障诊断方法,结合了有监督和无监督两部分,用于有效利用有限的高炉标记样本和大量的未标记样本;在有监督部分,针对标记数据和未标记数据之间的差距,采用了一种基于训练信号退火方法(tsa)的训练技术以防止过拟合;此外,无监督损失部分通过利用未标记数据来增强模型的平滑性,通过促使模型在加入对抗干扰前后的输出结果一致来实现;然后,基于幂迭代法和有限差分法设计了一种对抗扰动计算方法;最终,通过对有监督损失和无监督损失的整体训练,实现了鲁棒的故障诊断模型。
4、所述基于训练信号退火方法的有监督部分为:
5、首先,x1和y分别表示标记的输入变量和输出变量,则利用标注的数据部分建立有监督的交叉熵损失如下所示:
6、
7、其中,g(·)表示神经网络故障分类模型,是交叉熵函数,nl表示有标记样本的数量;基于训练信号退火方法,当模型在越来越多的未标记样本上进行训练时,来自标记样本的训练信号会逐渐释放,而不会出现过拟合,定义如下:
8、
9、其中,当满足括号内的条件时,τt表示相对于训练步骤t的阈值,为了根据需要控制未标记数据与已标记数据的比例,τt采用指数形式,用k为类别数,则:
10、
11、所述无监督损失部分为:
12、xu表示未标记样本的输入变量,使用kullback-leibler(kl)散度定义无监督损失如下:
13、
14、其中,nu表示未标记样本的数量,ψ表示模型参数,r表示扰动,对抗扰动定义如下:
15、所述基于幂迭代法和有限差分法的对抗扰动计算方法为:
16、
17、其中,h(xu,ψ)定义为海森矩阵,由公式给出:根据这一近似值,r是h(xu,ψ)在振幅ξ下的第一个主特征向量u;
18、
19、其中表示与最大特征向量方向相同的单位向量;假设d0是随机采样的初始单位向量,只要d0与主特征向量vmax不垂直,下面的迭代计算就会使dk收敛到vmax;
20、
21、hdi用有限差分法近似计算如下:
22、
23、通过反复应用公式来更新d:
24、
25、通过k次迭代,最终得到r的近似估计值:
26、
27、所述rscf模型的整体损失为:
28、rscf模型的整体鲁棒半监督分类损失通过权重因子μ(0<μ≤1)将标记的交叉熵损失和未标记的损失结合起来,
29、
30、本发明具有的有益效果:
31、1、通过结合有监督损失和无监督损失,提出了一种基于鲁棒半监督分类框架(rscf)的高炉炼铁过程故障诊断方法,旨在解决高炉炼铁过程中的故障标记数据集与未标记数据集之间的明显不平衡问题。
32、2、基于训练信号退火方法(tsa)的提出了有监督损失,有效缓解标记数据和未标记数据之间的巨大差距,防止模型在早期训练阶段对有限的标记数据过拟合。
33、3、通过利用未标记数据来增强模型的平滑性提出无监督损失。具体方法是促使模型在加入对抗干扰前后的输出结果一致,有效地增强了诊断模型的泛化能力和鲁棒性。
34、4、为了计算对抗扰动,设计了一种基于幂迭代法和有限差分法的高效计算方法。
1.一种基于鲁棒半监督分类框架(rscf)的高炉炼铁过程故障诊断方法,其特征在于,结合了有监督和无监督两部分,用于有效利用有限的高炉标记样本和大量的未标记样本;在有监督部分,针对标记数据和未标记数据之间的差距,采用了一种基于训练信号退火方法(tsa)的训练技术以防止过拟合;此外,无监督损失部分通过利用未标记数据来增强模型的平滑性,通过促使模型在加入对抗干扰前后的输出结果一致来实现;然后,基于幂迭代法和有限差分法设计了一种对抗扰动计算方法;最终,通过对有监督损失和无监督损失的整体训练,实现了鲁棒的故障诊断模型。
2.根据权利要求1所述的方法,其特征在于,所述基于训练信号退火方法的有监督部分为:
3.根据权利要求2所述的方法,其特征在于,所述无监督损失部分为:
4.根据权利要求3所述的方法,其特征在于,所述基于幂迭代法和有限差分法的对抗扰动计算方法为:
5.根据权利要求4所述的方法,其特征在于,所述rscf模型的整体损失为:
