1.本发明属于桥梁工程技术领域,特别涉及一种基于全贝叶斯的桥梁健康监测缺失数据修复方法。
背景技术:2.桥梁健康监测数据的完整性与可用性对于桥梁的损伤识别与早期预警有重要的影响。由于传感器安装不当、老化、恶劣天气等其他无法控制的因素,常常会导致监测传感器异常缺失。因此,准确地修复由于传感器异常导致的缺失数据十分重要。传统的数据缺失修复方法基本采用基于相关性、基于有限元模型、基于插值的各类算法,但大部分算法无法有效考虑监测数据的时间-空间特征,且往往是针对静态响应或者动态响应其中一种进行修复,无法同时对两种响应都准确地进行修复,同时,大多数算法都需要完整的训练数据集,而且训练后算法的参数都是确定的,无法考虑算法参数变量客观存在的不确定性。
技术实现要素:3.有鉴于此,本发明提供一种基于全贝叶斯的桥梁健康监测缺失数据修复方法,推断出监测数据的时间-空间特性,高效、准确地对缺失数据进行修复。
4.一种基于全贝叶斯的桥梁健康监测缺失数据修复方法,包括以下步骤:
5.1)基于桥梁监测数据进行预处理数据集构建;
6.2)基于掩模矩阵的随机缺失数据集构建;
7.3)基于贝叶斯公式的概率图模型构建;
8.4)从概率图模型中生成修复数据。
9.进一步,所述步骤1)的过程如下:
10.考虑基于m个传感器的监测数据集构建,将多个传感器在同一时间段t内的监测数据组装成一个m行t列的矩阵y:
11.y=(y1,y2,...,yi,...,ym)
t
ꢀꢀꢀꢀ
(1)
12.其中,yi是第i个传感器的一维随机变量,y则是由m个传感器构成的t维随机变量。则数据集可以定义为一个m
×
t维的随机变量y。
13.进一步,所述步骤2)的过程如下:
14.定义由掩模矩阵表示的含缺失数据的监测数据集,首先定义一个n维掩模矩阵随机变量:
15.m=(m1,m2,...,mi,...,mm)
ꢀꢀꢀ
(2)
16.其中m1,m2,...,mi,...,mm分别代表对应y1,y2,...,yi,...,ym一维掩模随机变量,则由m掩模y的随机变量为:
[0017][0018]
其中为y1,y2,...,yi,...,ym经m1,m2,...,mi,
…
,mm掩模后的随机变量,其具体值为:
[0019][0020]
其中,nan代表空值,因此被掩模的数据表示为缺失数据,而未被掩模的数据表示为非缺失数据。
[0021]
进一步,所述步骤3)的过程如下:
[0022]
先为各变量放置共轭先验分布,然后依据贝叶斯公式:
[0023][0024]
即后验分布正比于先验分布乘似然,得出各变量的后验分布,由于先验分布具备共轭性,所以后验分布的形式与先验分布的形式相同,可以实现利用计算机进行迭代计算。
[0025]
进一步,所述步骤4)的过程如下:
[0026]
构建的贝叶斯概率图模型实际上是构建了一个多维分布,因为维数过多导致无法得到闭式解,因此可以采用对该分布进行采样的方法求近似解。在边迭代边采样的过程中,采出的样本逐渐收敛于该分布。
[0027]
在此步骤中,贝叶斯矩阵分解模型的输人为不完整的数据集其余所有变量的值都由模型自动更新,无需人工手动调整。
[0028]
待模型计算结果收敛以后,仍计算一段时间再停止计算,收集收敛后r
(1)
,r
(2)
,....,r(i),...,r
(n)
共n个结果,其中r(i)是收敛后第i次迭代中输出的完整数据矩阵,
[0029]
计算停止后,对收集到的收敛后的若干结果取平均值作为最终结果的近似:
[0030][0031]
其中r
end
为模型最终重建的原始数据。根据掩模矩阵m提取r
end
对应原始数据缺失位置处的数据作为修复后的数据:
[0032][0033]
最终完成缺失数据的修复。
[0034]
本发明的技术构思为:获取无线传感网络储存的桥梁监测数据,利用掩模矩阵人为构建缺失数据,通过贝叶斯概率图模型挖掘剩余数据间的时间-空间特征关系,并使用采样作为计算手段,直接对数据集中的缺失数据进行修复。
[0035]
本发明的有益效果表现在:利用贝叶斯概率图模型学习了桥梁监测数据内部地时间-空间关联特征,并直接对缺失数据进行修复,无须完整地训练集。而且贝叶斯网络可以考虑参数的不确定性,无需手动调参。
附图说明
[0036]
图1为全贝叶斯的失真数据修复流程图;
[0037]
图2为原始数据图;
[0038]
图3为修复数据图。
具体实施方式
[0039]
为使本领域的技术人员更好地理解本发明的技术方案,下面结合实施例对本发明
提供的一种基于全贝叶斯的桥梁健康监测缺失数据修复方法进行详细描述。以下实施例仅用于说明本发明而非用于限制本发明的范围。
[0040]
实施例1
[0041]
如背景技术中所述,桥梁健康监测数据的完整性与可用性对于桥梁的损伤识别与早期预警有重要的影响。大部分算法无法有效考虑监测数据的时间-空间特征,且往往是针对静态响应或者动态响应其中一种进行修复,无法同时对两种响应都准确地进行修复,同时,大多数算法都需要完整的训练数据集,而且训练后算法的参数都是确定的,无法考虑算法参数变量客观存在的不确定性。因此亟需一种解决上述问题问题的数据修复方法。
[0042]
参考图1~图2,基于全贝叶斯的桥梁健康监测缺失数据修复方法,包括以下步骤:
[0043]
1)基于桥梁监测数据进行预处理数据集构建:
[0044]
考虑基于m个传感器的监测数据集构建,将多个传感器在同一时间段t内的监测数据组装成一个m行t列的矩阵y:
[0045]
y=(y1,y2,...,yi,...,ym)
t
ꢀꢀꢀꢀ
(1)
[0046]
其中,yi是第i个传感器的一维随机变量,y则是由m个传感器构成的t维随机变量。则数据集可以定义为一个m
×
t维的随机变量y。
[0047]
2)基于掩模矩阵的随机缺失数据集构建:
[0048]
定义由掩模矩阵表示的含缺失数据的监测数据集,首先定义一个n维掩模矩阵随机变量:
[0049]
m=(m1,m2,...,mi,...,mm)
ꢀꢀꢀꢀ
(2)
[0050]
其中m1,m2,...,mi,...,mm分别代表对应y1,y2,...,yi,...,ym一维掩模随机变量,则由m掩模y的随机变量为:
[0051][0052]
其中为y1,y2,...,yi,...,ym经m1,m2,...,mb...,mm掩模后的随机变量,其具体值为:
[0053][0054]
其中,nan代表空值,因此被掩模的数据表示为缺失数据,而未被掩模的数据表示为非缺失数据。
[0055]
3)基于贝叶斯公式的概率图模型构建:
[0056]
先为各变量放置共轭先验分布,然后依据贝叶斯公式:
[0057][0058]
即后验分布正比于先验分布乘似然,得出各变量的后验分布,由于先验分布具备共轭性,所以后验分布的形式与先验分布的形式相同,可以实现利用计算机进行迭代计算。
[0059]
4)从概率图模型中生成修复数据:
[0060]
构建的贝叶斯概率图模型实际上是构建了一个多维分布,因为维数过多导致无法得到闭式解,因此可以采用对该分布进行采样的方法求近似解。在边迭代边采样的过程中,采出的样本逐渐收敛于该分布。
[0061]
在此步骤中,贝叶斯矩阵分解模型的输人为不完整的数据集其余所有变量的值
都由模型自动更新,无需人工手动调整。
[0062]
待模型计算结果收敛以后,仍计算一段时间再停止计算,收集收敛后r
(1)
,r
(2)
,...,r(i),...,r
(n)
共n个结果,其中r(i)是收敛后第i次迭代中输出的完整数据矩阵,
[0063]
计算停止后,对收集到的收敛后的若干结果取平均值作为最终结果的近似:
[0064][0065]
其中r
end
为模型最终重建的原始数据。根据掩模矩阵m提取r
end
对应原始数据缺失位置处的数据作为修复后的数据:
[0066][0067]
最终完成缺失数据的修复。
[0068]
案例实施过程如下:
[0069]
(1)实验准备工作
[0070]
本实验选取烈士河大桥18个应变传感器一天的数据形成数据集,传感器的采样频率为1hz。
[0071]
数据集通过掩模矩阵自定义了多类缺失情况:每个传感器随机缺失20%,随机传感器随机结构化缺失随机长度的数据,每个传感器随机缺失20%+随机传感器随机结构化缺失随机长度的数。并进行多次检验
[0072]
设定的时间—空间特征矩阵的秩为18,提示矩阵揭示的掩模矩阵信息量为80%。
[0073]
(2)实验结果
[0074]
本实验将以均方根误差(rmse)最为评判指标,计算指标的公式为:
[0075][0076]
其中k为缺失数据的个数,x
prad
为最终修复的失真数据,x
trut
为原始真实数据,在各类缺失情况下,最终的修复效果如表1所示。
[0077]
表1
[0078][0079]
本发明通过无线传感网络获取原始完整监测数据集并随机模拟大体积连续缺失数据,通过剩余观测数据与其他传感器的时间-空间特征关系,利用贝叶斯概率图模型直接估算和修复缺失数据。本方法无须完整训练集,原始完整数据集仅用于验证方法的准确性,十分有效地提高了桥梁监测数据缺失数据的修复准确性。
[0080]
上面结合实施例对本发明的实例作了详细说明,但是本发明并不限于上述实例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出的各种变化,也应视为本发明的保护范围。
技术特征:1.一种基于全贝叶斯的桥梁健康监测缺失数据修复方法,其特征在于,包括以下步骤:1)基于桥梁监测数据进行预处理数据集构建;2)基于掩模矩阵的随机缺失数据集构建;3)基于贝叶斯公式的概率图模型构建;4)从概率图模型中生成修复数据。2.根据权利要求1所述的基于全贝叶斯的桥梁健康监测缺失数据修复方法,其特征在于,所述步骤1)的过程如下:考虑基于m个传感器的监测数据集构建,将多个传感器在同一时间段t内的监测数据组装成一个m行t列的矩阵y:y=(y1,y2,...,y
i
,
…
,y
m
)
t
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,y
i
是第i个传感器的一维随机变量,y则是由m个传感器构成的t维随机变量,则数据集可以定义为一个m
×
t维的随机变量y。3.根据权利要求2所述的基于全贝叶斯的桥梁健康监测缺失数据修复方法,其特征在于,所述步骤2)的过程如下:定义由掩模矩阵表示的含缺失数据的监测数据集,首先定义一个n维掩模矩阵随机变量:m=(m1,m2,...,m
i
,...,m
m
)
ꢀꢀꢀꢀꢀꢀ
(2)其中m1,m2,...,m
i
,...,m
m
分别代表对应y1,y2,...,y
i
,...,y
m
一维掩模随机变量,则由m掩模y的随机变量为:其中为y1,y2,...,y
i
,...,y
m
经m1,m2,...,m
i
,...,m
m
掩模后的随机变量,其具体值为:其中,nan代表空值,因此被掩模的数据表示为缺失数据,而未被掩模的数据表示为非缺失数据。4.根据权利要求3所述的基于全贝叶斯的桥梁健康监测缺失数据修复方法,其特征在于,所述步骤3)的过程如下:先为各变量放置共轭先验分布,然后依据贝叶斯公式:即后验分布正比于先验分布乘似然,得出各变量的后验分布,由于先验分布具备共轭性,所以后验分布的形式与先验分布的形式相同以实现利用计算机进行迭代计算。5.根据权利要求4所述的基于全贝叶斯的桥梁健康监测缺失数据修复方法,其特征在于,所述步骤4)的过程如下:贝叶斯矩阵分解模型的输人为不完整的数据集其余所有变量的值都由模型自动更新;待模型计算结果收敛以后,仍计算一段时间再停止计算,收集收敛后r
(1)
,r
(2)
,...,r
(i)
,...,r
(n)
共n个结果,其中r
(i)
是收敛后第i次迭代中输出的完整数据矩阵,计算停止后,对收集到的收敛后的若干结果取平均值作为最终结果的近似:其中r
end
为模型最终重建的原始数据,根据掩模矩阵m提取r
end
对应原始数据缺失位置处的数据作为修复后的数据:最终完成缺失数据的修复。
技术总结本发明公开了一种基于全贝叶斯的桥梁健康监测缺失数据修复方法,包括以下步骤:1)基于桥梁监测数据进行预处理数据集构建;2)基于掩模矩阵的随机缺失数据集构建;3)基于贝叶斯公式的概率图模型构建;4)从概率图模型中生成修复数据。本发明通过无线传感网络获取原始完整监测数据集并随机模拟大体积连续缺失数据,通过剩余观测数据与其他传感器的时间-空间特征关系,利用贝叶斯概率图模型直接估算和修复缺失数据。本方法无须完整训练集,原始完整数据集仅用于验证方法的准确性,十分有效地提高了桥梁监测数据缺失数据的修复准确性。了桥梁监测数据缺失数据的修复准确性。了桥梁监测数据缺失数据的修复准确性。
技术研发人员:李洁 吴刚 罗鹏 黄思杰 冯东明 谢海龙 林超 侯士通 韩之江 廖聿宸 陈伟 李向男 白磊 梁立江 郝仰玥 薛春梅 麻骏
受保护的技术使用者:东南大学
技术研发日:2022.06.14
技术公布日:2022/11/1