本发明属于建筑物识别领域,具体涉及基于置信学习的建筑物语义分割样本集错误样本剔除方法。
背景技术:
1、建筑物作为重要的地表覆盖要素之一,建筑物精准提取对于城市规划、人口估计、经济活动分布、灾害报告、违法乱建监测等具有重要作用。随着遥感大数据与人工智能相结合,尤其是深度学习语义分割技术成功运用到遥感影像解译,使得大范围建筑物精准提取成为可能,然而基于深度学习的遥感影像建筑物解译,需要海量高精度样本集用于训练语义分割模型。
2、传统的遥感智能高精度建筑物解译样本集依靠人工目视判断和标注,勾画出建筑物精准矢量边界,栅格化后裁切制作样本,这种方式费时费力、效率低下,无法满足遥感大数据分析和智能化信息提取的需求。历史建筑物成果矢量数据和众源开放地图数据为建筑物语义分割样本集的制作提供了丰富的线索数据,然而由于矢量成果数据的制作时间和遥感影像的成像时间未能准确对应,以及矢量成果数据存在漏标和误标,如果直接自动裁切制作样本集,样本集的精度较低,无法用于训练语义分割模型。
3、且遥感影像语义分割属于密集预测型任务,训练样本对像素级精度要求较高,另外在实际工程项目中高精度建筑物语义分割样本集主要依靠人工制作,耗费极大的人力物力,制作成本很高。而语义分割样本的错误和噪声问题普遍存在,深度学习网络由于数据过拟合的原因对这种问题解决较弱,造成泛化能力下降,因此剔除错误样本是提高模型精度和泛化性的重要手段。
4、针对上述问题,如何充分利用历史建筑物成果矢量数据和众源开放地图数据,自动化裁切制作海量语义分割样本集,剔除样本集中的错误样本,得到大规模高精度建筑物语义分割样本集,为训练构建高性能遥感智能建筑物解译模型提供数据支撑,是目前亟需解决的问题。
技术实现思路
1、针对现有技术的不足,本发明的目的是提供一种基于置信学习的建筑物语义分割样本集错误样本剔除方法,该方法利用置信学习实现对建筑物语义分割样本集中的错误样本剔除,能够被应用于大规模高精度建筑物语义分割样本集制作、建筑物遥感智能解译等领域。
2、为达到上述目的,本发明采用的技术方案如下:
3、一种基于置信学习的建筑物语义分割样本集错误样本剔除方法,包括如下步骤:
4、步骤1、将历史建筑物成果矢量和高分辨率影像裁切为s个初始建筑物语义分割样本,所述初始建筑物语义分割样本包含影像小片和标签小片;
5、步骤2、提取所述初始建筑物语义分割样本的各样本影像特征图,所述样本影像特征图至少包括建筑物存在指数特征图像、建筑物形态特征指数图像和建筑物几何热度图特征指数图像;
6、步骤3、以每个所述初始建筑物语义分割样本中单像素邻域为处理单元,将所述初始建筑物语义分割样本转换为邻域图像块识别样本,各所述邻域图像块识别样本均包括一个邻域图像块和中心像素标签;
7、步骤4、构建以深度学习图像识别残差网络为基分类器的置信学习模型;深度学习图像识别残差网络包括多个残差模块层、多个最大值池化层、1个全连接层和1个softmax层,该残差模块层的数量根据待处理样本量决定,样本规模较大时需要较多的残差模块层,残差模块层用于提取特征,全连接层和softmax层用于类别判定,每个残差模块层包含2个权重卷积层、2个relu激活函数。
8、步骤5、所述邻域图像块识别样本采用k折交叉验证的方式,估计噪声标签和真实标签的联合分布;
9、步骤6、使用所述噪声标签和真实标签的联合分布查找错误标签,通过错误标签在所述初始建筑物语义分割样本中的占比,根据置信度阀值法估计出初始建筑物语义分割样本集中的错误样本。
10、进一步地,还包括步骤7:根据所述错误样本的查准率和查全率评估本样本剔除方法。
11、进一步地,所述错误样本的查准率和查全率评估本样本剔除方法,具体包括:
12、对所述步骤1中所述s个初始建筑物语义分割样本进行人工目视判断,找出错误样本和正确样本,作为本方法精度评估的参考真值,将所述步骤6找出的初始建筑物语义分割样本集中的错误样本与参考真值进行比对,计算查全率和查准率,所述查全率recall计算公式为:
13、
14、其中,maneorry代表被人工目视找出为错误语义分割样本的数量,tp代表同时被本建筑物语义分割样本集错误样本剔除方法和人工目视找出为错误语义分割样本的数量;
15、所述查准率precision计算公式为:
16、
17、其中,cleaneorry代表被本建筑物语义分割样本集错误样本剔除方法找出为错误语义分割样本的数量。
18、进一步地,所述步骤1将历史建筑物成果矢量和高分辨率影像裁切为s个初始建筑物语义分割样本,所述初始建筑物语义分割样本包含影像小片和标签小片,包括:
19、步骤1.1、获取高分辨率影像数据和对应区域的建筑物成果矢量数据,进行配准和几何精校正,将矢量数据转为和影像相同空间分辨率的栅格数据;
20、步骤1.2、将所述栅格数据作为标签真值,并对比影像和标签真值,利用m*m像素尺寸的滑动窗口按照m像素步长上下左右移到批量切割影像和标签真值,m的大小一般为512的倍数,得到包括影像小片和标签小片的语义分割样本,且删除标签小片中像素全为背景的样本,得到s个初始建筑物语义分割样本,每个初始建筑物语义分割样本包括一个m*m像素尺寸的影像小片和一个m*m像素尺寸的标签小片。
21、进一步地,所述步骤2中提取各所述初始建筑物语义分割样本的样本影像特征图,包括:
22、基于灰度共生矩阵提取的对比度纹理特征,构建建筑物存在指数bpindex,对所述初始建筑物语义分割样本的影像小片提取具有建筑物纹理特征的建筑物存在指数特征图像;
23、基于形态学白色顶帽变换和黑色顶帽变换,构建建筑物形态特征指数bmfindex,对所述初始建筑物语义分割样本的影像小片提取具有建筑物形态特征的建筑物形态特征指数图像;
24、基于shi-tomasi算子检测角点特征、利用edlines算法提取直线段特征,构建角点和直线段相互约束的建筑物几何热度图特征指数bghotindex,对所述初始建筑物语义分割样本的影像小片提取具有建筑物角点、边缘线条几何特征的建筑物几何热度图特征指数图像。
25、进一步地,所述步骤2中提取各所述初始建筑物语义分割样本的样本影像特征图,具体包括:
26、步骤2.1、对于裁切后m*m像素尺寸的建筑物语义分割样本影像小片,三个波段取平均值,将灰度级线性降维至lg个,lg可取32、64,以5*5的邻域尺寸为滑窗遍历所有像素,语义分割样本影像最外圈像素需要向外复制扩展2次,在该邻域滑窗内计算12个位移矢量的灰度共生矩阵glcm,基于每个灰度共生矩阵glcm计算对比度纹理特征值;
27、步骤2.2、取所有位移矢量的12个对比度特征值的最大值为邻域滑窗内中心像素的建筑物存在指数bpindex值,如下式所示:
28、bpindex=max(window=5,vd,cond)
29、其中,max表示取最大值运算,window=5表示领域滑窗的尺寸为5*5像素,vd为用于计算灰度共生矩阵glcm的位移矢量,d的取值为1~12,代表总共12个位移矢量;cond为vd对应计算出的对比度纹理特征值,建筑物存在指数bpindex为所有cond的最大值,cond的计算公式为:
30、
31、式中row,col为glcm中行列方向离散灰度级的值,取值范围为1~64,p(row,col)为glcm中第row行第col列对应的值;
32、步骤2.3、对于裁切后m*m像素尺寸的建筑物语义分割样本影像小片,三个波段取平均值,进行形态学白帽变换和黑帽变换,取多个线条结构体元素的白帽变换与黑帽变换差值的平均值为建筑物形态特征指数bmfindex,计算公式如:
33、
34、表示尺寸为、方向为的线性结构元素,为线条结构元素的尺寸总个数和方向总个数,取值为0~l内,取值为0~f内的方向,和f取值依据所用影像的具体分辨率,其中白帽变换和的计算公式为:
35、
36、open(a,linel,f)表示运用线条结构体元素linel,f对取平均值后的图像a进行开运算,close(a,linel,f)表示运用线条结构体元素linel,f对取平均值后的图像a进行闭运算;
37、步骤2.4、对于裁切后m*m像素尺寸的建筑物语义分割样本影像小片,三个波段取平均值转为单波段灰度图像,利用shi-tomasi算法提取角点、利用edlines直线检测算法提取影像上的直线段,再根据直线段之间距离和方向关系,提取影像上直角特征,进而设计了多种几何特征自检与互检的筛选机制,获得建筑物的角点、直线段和直角几何特征,并对筛选后高质量的建筑物几何特征利用自然邻域插值法计算得到样本影像的建筑物几何热度图特征指数bghotindex。
38、进一步地,所述步骤2.4,具体包括:
39、步骤2.4.1、采用shi-tomasi算法检测角点,利用限制两个特征点之间的最小距离及局部极大值条件进行约束,检测出样本影像上的角点;
40、
41、其中i(x,y)是局部窗口的影像灰度,i(x+u,y+v)是平移后的图像灰度,ω(x,y)是窗口函数,窗口大小为ws,u、v为窗口在x、y方向移动距离,角点检测中使e(u,v)的值最大,i(x+u,y+v)进行一阶泰勒展开后表示为i(x,y)+ixu+iyv,其中ix和iy是沿x和y方向的导数,用sobel算子计算,e(u,v)表示为:
42、
43、令自相关矩阵mat决定了e(u,v)的取值,利用mat来求角点,mat是ix和iy的二次项函数,mat的特征值为γ1和γ2;
44、角点的稳定性与矩阵mat的较小特征值有关,利用最小的那个特征值作为分数sc:
45、sc=min(γ1,γ2)
46、shi-tomasi角点检测的结果是带有这些分数sc的灰度图像,设定一个阈值ts,当sc>ts时对应的像素就是角点;
47、步骤2.4.2、对初始建筑物语义分割样本影像多个波段取平均值转为单波段灰度图像,利用edlines算法的ed边缘检测器对所述单波段灰度图像生成一组干净、连续的边缘像素链,再根据最小二乘法原理从边缘线段中提取直线,并采用helmholtz原理消除检测错误的直线段;
48、步骤2.4.3、对于edlines算法检测出的直线段,当两直线段之间有相交、且方向asp满足80°<asp≤90°时,提取到样本影像上直角特征;
49、步骤2.4.4、设计角点、直线段、直角这三种几何特征自检与互检的筛选机制,获得样本影像上建筑物的角点、直线段、直角几何特征:
50、a、对shi-tomasi角点进行自检,如果角点pj周围的区域dj内存在大于σ数量的角点,则角点pj保留,否则删除;
51、
52、其中为当前角点集合,为当前角点周围角点个数,σ为个数阈值;
53、b、对edlines检测出的直线段进行长度自检,删除长度小于阈值lt的直线段,lt根据影像分辨率和影像上建筑物的最小尺寸设定;
54、c、对角点和直线段之间进行互检,角点的dj半径范围内没有直线段则该角点为是弱角点,直线段的dl半径内没有角点则该直线段为伪直线段,删除弱角点和伪直线段;
55、d、基于edlines直线段检测出的某个直角的垂足在dz半径范围内要存在至少一个角点,否则就删除该直角;
56、步骤2.4.5、对筛选后高质量的角点、直线段、直角几何特征,分别转为二值图,角点、直线段、直角的像素值为255,背景像素值为0,再利用自然邻域插值法计算得到样本影像的建筑物几何热度图特征指数bghotindex;
57、
58、其中bghotindex(a,b)为坐标a、b位置的建筑物几何热度值,为第个参与插值的角点二值图的真值,为对应的权重,为第个参与插值的直线段二值图的真值,为对应的权重,为第个参与插值的直角二值图的真值,为对应的权重,hj、hl、hz分别为角点二值图中角点数量、直线段二值图中直线段数量、直角二值图中直角数量,真值v和权重w由泰森多边形确定;
59、
60、其中area(a,b)是以(a,b)为中心的新单元的面积,新单元即新建立的泰森多边形,是以(a,b)为中心的新单元与以(a,b)为中心的旧单元之间的交集的面积,旧单元即原本的泰森多边形。
61、进一步地,所述步骤3中以每个所述初始建筑物语义分割样本中单像素邻域为处理单元,将所述初始建筑物语义分割样本转换为邻域图像块识别样本,各所述邻域图像块识别样本均包括一个邻域图像块和中心像素标签,包括:
62、步骤3.1、对每个建筑物语义分割样本,以n*n的邻域尺寸为滑窗,n的大小由影像分辨率决定,一般取3、5、7、9、11、13、15,滑窗从左至右、从上至下移动,每次移动的距离为q;
63、步骤3.2、将原始样本影像小片、所述建筑物存在指数特征图像、所述建筑物形态特征指数特征图像和所述建筑物几何热度图特征指数特征图像进行叠合得到六个波段的数据,以n*n的邻域尺寸滑窗对叠合后的六个波段数据裁切得到邻域图像块,该邻域图像块均由原始影像块、所述建筑物存在指数特征图像、所述建筑物形态特征指数特征图像和所述建筑物几何热度图特征指数特征图像叠合组成,所述邻域图像块样本的标签为该邻域滑窗中心位置像素的类别标签,一个建筑物语义分割样本能产生r个邻域图像块识别样本;
64、步骤3.3、所有初始建筑物语义分割样本转换为邻域图像块识别样本,转换后产生r*s个邻域图像块识别样本,前r个邻域图像块识别样本对应初始语义分割样本集中的第一个,第z*r个到第(z+1)*r个邻域图像块识别样本对应初始语义分割样本集中的第z+1个,z的取值范围为0到s-1。
65、进一步地,所述步骤5,所述邻域图像块识别样本采用k折交叉验证的方式,估计噪声标签和真实标签的联合分布,包括:
66、定义噪声标签为即所有邻域图像块识别样本标签,其中含有正确也有错误标签;定义真实标签为lb*,但事实上并不会获得真实标签,通过k折交叉验证对真实标签进行估计,k=2,3,4,5,类别总数为cl,
67、步骤5.1、通过对所有邻域图像块识别样本数据进行k折交叉验证,α表示样本,β表示类别,计算第α个样本在第β个类别下的概率p[α][β],然后计算每个类别β下的平均概率t[β]作为置信度阈值,最后对于邻域图像块识别样本α,其真实标签lb*为第β个类别中的最大概率argmaxβp[α][β]对应的标签,并且p[α][β]>t[β];
68、步骤5.2、计算计数矩阵类似于混淆矩阵;
69、步骤5.3、标定计数矩阵,让计数总和与所有邻域图像块识别样本标签的总数相同,所述标定计数矩阵的计算公式为:
70、
71、其中为所有邻域图像块识别样本标签的样本总数,为标定后的计数矩阵;
72、步骤5.4、估计噪声标签和真实标签lb*的联合分布所述联合分布的计算公式为:
73、
74、步骤6、使用所述噪声标签和真实标签的联合分布查找错误标签,通过错误标签在所述初始建筑物语义分割样本中的占比,根据置信度阀值法估计出初始建筑物语义分割样本集中的错误样本。
75、步骤6.1,根据噪声标签和真实标签的联合分布同时采用按类修剪pruneby class(pbc)和按噪声率修剪prune bynoise rate(pbnr)的方式过滤找出错误样本;
76、步骤6.2、对于r*s个邻域图像块识别样本,通过所述步骤6.1确定每个样本是否为错误样本,如果第z*r个到第(z+1)*r个邻域图像块识别样本中错误样本的比例超过设定的阈值θ,则表明初始建筑物语义分割样本集中的第z+1个样本为错误样本。
77、本发明的显著效果是:
78、(1)本发明对建筑物成果矢量数据和遥感影像进行滑窗裁切,得到大量初始建筑物语义分割样本,再利用置信学习算法建立模型,实现了对错误样本的查找和剔除,提高了大规模建筑物语义分割样本集制作的效率和精度。有效解决了现有海量高精度遥感语义分割样本集制作依赖人工标注和人工筛查精化,相较于人工目视标注制作高精度样,极大地提高了海量建筑物语义分割样本的制作效率和精度。
79、(2)采用深度学习图像识别残差网络,并作为置信学习的基分类器,以像素邻域图像块为单元,该邻域图像块包含了由bpindex、bmfindex和bghotindex提取的建筑物纹理特征、形态特征和几何特征,将初始建筑物语义分割样本转换为置信学习可以处理的图像块识别样本,进而通过查找错误的邻域图像块识别样本和阈值法来确定建筑物语义分割样本的准确性,本发明方法具有科学性、合理性和可行性。
80、(3)本发明方法对海量高精度遥感场景识别样本、目标检测样本、遥感变化检测样本的制作具有借鉴意义,另外本发明方法还可以应用于医学影像分割、自然图片分割等大规模高精度遥感语义分割样本集制作、遥感影像智能解译领域。
1.一种基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:还包括步骤7:根据所述错误样本的查准率和查全率评估本样本剔除方法。
3.根据权利要求2所述的基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述错误样本的查准率和查全率评估本样本剔除方法,具体包括:
4.根据权利要求1所述的基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤1将历史建筑物成果矢量和高分辨率影像裁切为s个初始建筑物语义分割样本,所述初始建筑物语义分割样本包含影像小片和标签小片,包括:
5.根据权利要求1或4所述的基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤2中提取各所述初始建筑物语义分割样本的样本影像特征图,包括:
6.根据权利要求5所述基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤2中提取各所述初始建筑物语义分割样本的样本影像特征图,具体包括:
7.根据权利要求6所述基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤2.4,具体包括:
8.根据权利要求1所述基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤3中以每个所述初始建筑物语义分割样本中单像素邻域为处理单元,将所述初始建筑物语义分割样本转换为邻域图像块识别样本,各所述邻域图像块识别样本均包括一个邻域图像块和中心像素标签,具体包括:
9.根据权利要求1所述基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤5,所述邻域图像块识别样本采用k折交叉验证的方式,估计噪声标签和真实标签的联合分布,包括:
10.根据权利要求8所述基于置信学习的建筑物语义分割样本集错误样本剔除方法,其特征在于:所述步骤6、使用所述噪声标签和真实标签的联合分布查找错误标签,对于每一个初始建筑物语义分割样本,通过错误标签在所述初始建筑物语义分割样本中的占比,根据置信度阀值法估计出初始建筑物语义分割样本中的错误样本,具体包括:
