1.本发明涉及图像处理技术领域,更具体的说是涉及一种基于结构相似性度量的图像分割方法、装置及终端设备。
背景技术:2.近几年来,随着工业机器人技术日趋成熟,其被广泛应用于各自动化生产流水线,不仅提高了生产效率,减少了工人劳动量,大大提高了经济效益。但传统的工业机器人在灵活性、多任务性和实时性方面存在严重不足,当面对产品形状、尺寸或工艺流程改变的情况时,需要进行重新示教描点和编程,大大影响了自动化生产线的效率。机器视觉图像分割可以为工业机器人提供目标的正确位置以及边界,极大提高工业机器人抓取和放置目标的准确性,提高工业机器人在实际使用中的环境感知能力。
3.图像分割算法主要分为三大类,分别是基于阈值的分割方法,基于边缘的分割方法,基于区域的分割方法。基于阈值的分割方法对噪声十分敏感,应用直方图的峰谷法分割前景和背景灰度时对重叠位置容易产生误分割;基于边缘的分割方法适用于目标边缘分明的应用场景,因为常用的边缘检测算子容易找假边缘且易丢失边缘;基于区域的分割方法容易造成图像的过度分割和欠分割,且容易受到连续特征的影响。
4.目前,基于深度学习的机器视觉图像分割任务主要存在三大挑战:
5.(1)工业机器人采集到的待抓取目标图像易受到光照、阴影和环境温度的影响,图像获取的好坏决定了分割模型的可靠性和准确性。
6.(2)工业机器人使用环境存在目标和背景颜色一致,造成分割困难。
7.(3)待抓取目标形状和大小变化较大,分割模型需正确分割多样变化的抓取目标图像。
8.因此,如何提供一种能够提高分割准确率和分割视觉效果的基于结构相似性度量的图像分割方法、装置及终端设备是本领域技术人员亟需解决的问题。
技术实现要素:9.有鉴于此,本发明提供了一种基于结构相似性度量的图像分割方法、装置及终端设备,通过对于特征点间的结构相似性的特征表达,显著提高图像分割的准确率和视觉效果。
10.为了实现上述目的,本发明采用如下技术方案:
11.一种基于结构相似性度量的图像分割方法,包括训练阶段和分割阶段;
12.训练阶段包括:
13.获取基于机器视觉的训练集,并进行预处理;所述训练集包括训练集原始图像和对应的训练集标注图像;
14.对所述训练集原始图像和所述训练集标注图像进行分块操作,得到训练集原始图像子图和训练集标注图像子图;
15.构建包括编码路径和解码路径的u形分割网络;
16.利用所述训练集原始图像子图和所述训练集标注图像子图对所述u形分割网络进行训练,将所述u形分割网络预测输出的训练集分割图像子图进行拼接获得完整的训练集分割图像,并利用交叉熵损失函数最小化训练集分割图像子图和训练集标注图像子图间的差异,优化所述u形分割网络参数;
17.分割阶段包括:
18.获取基于机器视觉的待分割原始图像,并进行预处理和分块操作,得到待分割原始图像子图;
19.将所述待分割原始图像子图输入训练好的所述u形分割网络,得到分割图像子图,并将属于同一原始待分割图像的各个所述分割图像子图按照分块顺序进行拼接,得到最终的分割图像。
20.进一步的,在上述一种基于结构相似性度量的图像分割方法中,所述交叉熵损失函数的表达式为:
[0021][0022]
其中,n表示像素点个数,表示对像素点i的预测,y(i)表示像素点i对应的真实标签。
[0023]
进一步的,在上述一种基于结构相似性度量的图像分割方法中,对待分割原始图像或所述训练集进行预处理,包括:采用hsv拉伸方法增强图像对比度。
[0024]
进一步的,在上述一种基于结构相似性度量的图像分割方法中,所述编码路径包括4个重复的结构相似性度量编码单元;所述解码路径包括与所述编码路径特征深度相同的3个重复的解码单元;将对应特征深度的所述结构相似性度量编码单元和所述解码单元进行串连;
[0025]
每个所述结构相似性度量编码单元包括2个卷积层、1个池化层和1个结构相似性权重计算模组;
[0026]
每个所述解码单元包括2个卷积层和1个转置卷积层。
[0027]
进一步的,在上述一种基于结构相似性度量的图像分割方法中,在训练阶段,所述结构相似性权重计算模组执行以下步骤:
[0028]
遍历所述训练集原始图像子图的每个特征点位置处的特征点向量;
[0029]
利用全局池化层计算所述训练集原始图像子图的全局特征向量;
[0030]
计算所述训练集原始图像子图的全局特征向量和特征点向量间的结构相似性权重;
[0031]
将所述结构相似性权重加权到对应的特征点向量上,形成加权特征图;
[0032]
将所述训练集原始图像子图与所述加权特征图沿着特征通道的方向进行特征图堆叠。
[0033]
进一步的,在上述一种基于结构相似性度量的图像分割方法中,所述结构相似性权重的计算公式为:
[0034]wmn
=l(m,n)c(m,n)u(m,n)
[0035][0036][0037][0038]
其中,w
mn
表示结构相似性权重;l(m,n)、c(m,n)和u(m,n)分表示m和n间的亮度、对比度和结构相似性;m表示原始图像子图的全局特征向量,通过全局平均池化实现,n表示原始图像子图中位于(x,y)处的特征点向量;μm表示全局特征向量m的均值,μn表示特征点向量n的均值;σm表示全局特征向量m的标准差,σn表示特征点向量n的标准差,σ
mn
表示m和n间的协方差;c1、c2、c3为常数项;
[0039]
所述加权特征图的计算公式为:
[0040]n′
=w
mn
n,
[0041]
其中,n
′
表示加权后的特征点向量。
[0042]
本发明还提供一种基于结构相似性度量的图像分割装置,包括:
[0043]
获取模块,用于获取基于机器视觉的待分割原始图像;
[0044]
预处理模块,用于对所述待分割原始图像进行预处理;
[0045]
图像分块模块,用于对预处理后的待分割原始图像进行分块操作,得到待分割原始图像子图;
[0046]
分割预测模块,用于采用上述训练好的u形分割网络对所述待分割原始图像子图进行分割,得到分割图像子图,并将属于同一原始待分割图像的各个所述分割图像子图按照分块顺序进行拼接,得到最终的分割图像。
[0047]
进一步的,在上述一种基于结构相似性度量的图像分割装置中,所述预处理模块包括:
[0048]
rgb-hsv映射单元,用于将待分割原始图像从rgb色彩空间映射到hsv色彩空间;
[0049]
归一化单元,用于将hsv色彩空间的待分割原始图像的s通道和v通道进行最小-最大化归一化处理;
[0050]
映射单元,用于将待分割原始图像从hsv色彩空间重新映射回rgb色彩空间。
[0051]
进一步的,在上述一种基于结构相似性度量的图像分割装置中,所述分割预测模块包括u形网络单元和子图拼接单元;其中,所述u形网络单元包括:编码路径层、解码路径层和监督单元和损失函数单元:
[0052]
所述编码路径层包括4个重复的结构相似性度量编码单元;每个所述结构相似性度量编码单元包括2个卷积层、1个池化层和1个结构相似性权重计算模组;
[0053]
所述解码路径层包括与所述编码路径层特征深度相同的3个重复的解码单元;对应特征深度的所述结构相似性度量编码单元和所述解码单元串连;每个所述解码单元包括2个卷积层和1个转置卷积层;
[0054]
所述监督单元用于将待分割原始图像作为监督信息;
[0055]
所述子图拼接单元用于将属于同一所述待分割原始图像的分割子图像按照分块
顺序进行拼接,得到最终的分割图像;
[0056]
所述损失函数单元用于在训练阶段对所述u形分割网络的参数进行优化。
[0057]
本发明还提供一种终端设备,包括至少一个处理器和与所述处理器通信连接的至少一个存储器;所述存储器存储有可被所述处理器执行的程序指令;所述处理器运行所述程序指令时,执行如上所述的基于结构相似性度量的图像分割方法的步骤。
[0058]
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于结构相似性度量的图像分割方法、装置及终端设备,具有以下有益效果:本发明将分块图片的全局特征向量和特征点向量进行结构相似性度量,通过对分块图片引入全局语义和单一特征点语义的结构相似性权重,使特征点以上下文信息加权,结构相似性越高说明特征点对分割目标的贡献越大,提高了分割模型的特征表达能力,从而提升分割对象的边缘分割精度,可以广泛应用于拥有机器视觉的工业机器人的流水线作业,同时可以在待分割目标尺寸和形状变化较大的情况下,提高分割的准确率和分割的视觉效果。
附图说明
[0059]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0060]
图1为本发明提供的基于结构相似性度量的图像分割方法的流程图;
[0061]
图2为本发明提供的u形分割网络的结构示意图;
[0062]
图3为本发明提供的对待分割原始图像子图进行结构相似性度量的流程图;
[0063]
图4为本发明提供的u形分割网络的训练阶段和测试阶段的数据流向示意图;
[0064]
图5为本发明提供的基于结构相似性度量的图像分割装置的结构示意图。
具体实施方式
[0065]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0066]
如图1、图4所示,本发明实施例公开了一种基于结构相似性度量的图像分割方法,包括训练阶段和分割阶段;
[0067]
训练阶段包括:
[0068]
s1、获取基于机器视觉的训练集,并进行预处理;训练集包括训练集原始图像和对应的训练集标注图像;
[0069]
s2、对训练集原始图像和训练集标注图像进行分块操作,得到训练集原始图像子图和训练集标注图像子图;
[0070]
s3、构建包括编码路径和解码路径的u形分割网络;
[0071]
s4、利用训练集原始图像子图和训练集标注图像子图对u形分割网络进行训练,将u形分割网络预测输出的训练集分割图像子图进行拼接获得完整的训练集分割图像,并利
用交叉熵损失函数最小化训练集分割图像子图和训练集标注图像子图间的差异,优化u形分割网络参数;
[0072]
分割阶段包括:
[0073]
s5、获取基于机器视觉的待分割原始图像,并进行预处理和分块操作,得到待分割原始图像子图;
[0074]
s6、将待分割原始图像子图输入训练好的u形分割网络,得到分割图像子图,并将属于同一原始待分割图像的各个分割图像子图按照分块顺序进行拼接,得到最终的分割图像。
[0075]
下面对上述各步骤进行进一步说明。
[0076]
s1中,对基于机器视觉的训练集中的图片进行数据增强操作,具体可采用hsv拉伸方法增强图像对比度,使图像边界更清晰,通过下述过程实现:
[0077]
1)将训练集原始图像从rgb色彩空间映射到hsv色彩空间;
[0078]
2)对训练集原始图像的s和v通道进行最小-最大归一化(min-max normalization);归一化函数如下所示:
[0079][0080][0081]
其中,s(x,y)表示(x,y)处s色彩通道的值,v(x,y)表示(x,y)处v色彩通道的值,max(x,y)表示s或v色彩通道的最大值,min(x,y)表示s或v色彩通道的最小值。
[0082]
3)将训练集原始图像重新映射回rgb色彩空间。
[0083]
s2中,对训练集原始图像进行分块操作的具体步骤如下:
[0084]
使用统一大小的滑动窗口对训练集原始图像从上到下、从左到右遍历,相邻两个滑动窗口之间无重叠部分;训练集原始图像的尺寸需为滑动窗口尺寸的整数倍,当训练集原始图像的尺寸为512
×
1024时,滑动窗口尺寸可为128
×
256或64
×
128;当训练集原始图像的尺寸为256
×
256时,滑动窗口尺寸可为32
×
32或16
×
16。
[0085]
在一个具体实施例中,s3中,如图2所示,u形分割网络包括编码路径和解码路径;编码路径在提取图像中语义特征的同时降低图像分辨率,解码路径用于恢复图像的分辨率至原尺寸。为了在提取特征信息的同时保留编码阶段每个特征深度特征图的像素位置信息,u形分割网络设置了相同特征深度的编码单元到解码单元间的特征图串连。最后,u形分割网络利用softmax激活函数判别恢复分辨率后的特征图中每个像素的类别,进而得到最终的分割图像子图。
[0086]
具体的,编码路径包括4个重复的结构相似性度量编码单元;解码路径包括与编码路径特征深度相同的3个重复的解码单元;将对应特征深度的结构相似性度量编码单元和解码单元进行串连;串连方式为将特征图沿着特征通道方向堆叠。
[0087]
每个结构相似性度量编码单元包括2个卷积层、1个池化层和1个结构相似性权重计算模组;结构相似性权重计算模组用于实现度量全局特征向量和特征点向量间结构相似性权重的目的。
[0088]
每个解码单元包括2个卷积层和1个转置卷积层。
[0089]
s4中对u形分割网络的训练阶段,利用训练集原始图像子图和训练集标注图像子图对u形分割网络进行训练,将u形分割网络预测输出的训练集分割图像子图进行拼接获得完整的训练集分割图像。
[0090]
拼接操作就是进行图像拼接,将属于同一分割图像的分割图像子图重新拼接成分割图像从而获得具有原始尺寸的机器视觉图像。通过交叉熵损失函数最小化分割图像子图和标注图像子图间的差异以优化分割网络的分割效果。
[0091]
其中,交叉熵损失函数的表达式为:
[0092][0093]
其中,n表示像素点个数,表示对像素点i的预测,y(i)表示像素点i对应的真实标签。
[0094]
具体的,在训练阶段,结构相似性权重计算模组执行以下步骤:
[0095]
遍历训练集原始图像子图的每个特征点位置处的特征点向量;可利用尺寸为1
×
1、步长为1的滑动窗口遍历待分割原始图像子图上每个特征点的特征点向量。
[0096]
利用全局池化层计算训练集原始图像子图的全局特征向量;
[0097]
计算训练集图像子图的全局特征向量和特征点向量间的结构相似性权重;
[0098]
将结构相似性权重加权到对应的特征点向量上,形成加权特征图;
[0099]
将训练集原始图像子图与加权特征图沿着特征通道的方向进行特征图堆叠。
[0100]
堆叠后的特征图经过网络的最末端即激活函数softmax之后,得到分割图像子图,然后将属于同一个原始图像的子图从上到下从左到右进行拼接,恢复图像的原始尺寸。
[0101]
其中,结构相似性权重的计算公式为:
[0102]wmn
=l(m,n)c(m,n)u(m,n)
[0103][0104][0105][0106]
其中,w
mn
表示结构相似性权重;l(m,n)、c(m,n)和u(m,n)分表示m和n间的亮度、对比度和结构相似性;m表示原始图像子图的全局特征向量,通过全局平均池化实现,n表示原始图像子图中位于(x,y)处的特征点向量;μm表示全局特征向量m的均值,μn表示特征点向量n的均值;σm表示全局特征向量m的标准差,σn表示特征点向量n的标准差,σ
mn
表示m和n间的协方差;c1、c2、c3为常数项;
[0107]
加权特征图的计算公式为:
[0108]n′
=w
mn
n,
[0109]
其中,n
′
表示加权后的特征点向量。
[0110]
具体的,s5中,获取基于机器视觉的待分割原始图像,并进行预处理和分块操作,
得到待分割原始图像子图。本实施例中,对待分割原始图像进行与s1步骤相同的预处理操作和与s2相同的分块操作。
[0111]
在其他实施例中,如图5所示,本发明还提供一种基于结构相似性度量的图像分割装置,包括:
[0112]
获取模块,用于获取基于机器视觉的待分割原始图像;
[0113]
预处理模块,用于对待分割原始图像进行预处理;
[0114]
图像分块模块,用于对预处理后的待分割原始图像进行分块操作,得到待分割原始图像子图;
[0115]
分割预测模块,用于采用训练好的u形分割网络对待分割原始图像子图进行分割,得到分割图像子图,并将属于同一原始待分割图像的各个分割图像子图按照分块顺序进行拼接,得到最终的分割图像。
[0116]
在一个实施例中,预处理模块包括:
[0117]
rgb-hsv映射单元,用于将待分割原始图像从rgb色彩空间映射到hsv色彩空间;
[0118]
归一化单元,用于将hsv色彩空间的待分割原始图像的s通道和v通道进行最小-最大化归一化处理;
[0119]
映射单元,用于将待分割原始图像从hsv色彩空间重新映射回rgb色彩空间。
[0120]
在一个实施例中,分割预测模块包括:u形网络单元和子图拼接单元,所述u形网络单元包括:编码路径层、解码路径层、监督单元和损失函数单元;编码路径层包括4个重复的结构相似性度量编码单元;每个结构相似性度量编码单元包括2个卷积层、1个池化层和1个结构相似性权重计算模组;
[0121]
其中,解码路径层包括与编码路径层特征深度相同的3个重复的解码单元;对应特征深度的结构相似性度量编码单元和解码单元串连;每个解码单元包括2个卷积层和1个转置卷积层;
[0122]
监督单元用于将待分割原始图像作为监督信息;
[0123]
子图拼接单元,子图拼接单元用于将属于同一待分割原始图像的分割子图像按照分块顺序进行拼接,得到最终的分割图像;
[0124]
损失函数单元,损失函数单元用于在训练阶段对u形分割网络的参数进行优化。
[0125]
在一个具体实施例中,结构相似性权重计算模组包括:
[0126]
像素扫描单元,用于遍历待分割原始图像子图的每个特征点位置处的特征点向量;
[0127]
全局特征向量单元,用于利用全局池化层计算待分割原始图像子图的全局特征向量;
[0128]
结构相似性权重计算单元,用于计算待分割原始图像子图的全局特征向量和特征点向量间的结构相似性权重;
[0129]
特征图加权单元,用于将结构相似性权重加权到对应的特征点向量上,形成加权特征图;
[0130]
跳层连接单元,用于将待分割原始图像子图与加权特征图沿着特征通道的方向进行特征图堆叠。本发明实施例通过在编码路径层和解码路径层之间的设置跳层连接单元,可以在训练阶段防止加入的结构相似性特征的丢失,显著提高像素分类的准确性,进而更
精确地分割目标。
[0131]
本发明还提供一种终端设备,包括至少一个处理器和与处理器通信连接的至少一个存储器;存储器存储有可被处理器执行的程序指令;处理器运行程序指令时,执行如上的基于结构相似性度量的图像分割方法的步骤。
[0132]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0133]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
技术特征:1.一种基于结构相似性度量的图像分割方法,其特征在于,包括训练阶段和分割阶段;训练阶段包括:获取基于机器视觉的训练集,并进行预处理;所述训练集包括训练集原始图像和对应的训练集标注图像;对所述训练集原始图像和所述训练集标注图像进行分块操作,得到训练集原始图像子图和训练集标注图像子图;构建包括编码路径和解码路径的u形分割网络;利用所述训练集原始图像子图和所述训练集标注图像子图对所述u形分割网络进行训练,将所述u形分割网络预测输出的训练集分割图像子图进行拼接获得完整的训练集分割图像,并利用交叉熵损失函数最小化训练集分割图像子图和训练集标注图像子图间的差异,优化所述u形分割网络参数;分割阶段包括:获取基于机器视觉的待分割原始图像,并进行预处理和分块操作,得到待分割原始图像子图;将所述待分割原始图像子图输入训练好的所述u形分割网络,得到分割图像子图,将属于同一原始待分割图像的各个所述分割图像子图按照分块顺序进行拼接,得到最终的分割图像。2.根据权利要求1所述的一种基于结构相似性度量的图像分割方法,其特征在于,所述交叉熵损失函数的表达式为:其中,n表示像素点个数,表示对像素点i的预测,y
(i)
表示像素点i对应的真实标签。3.根据权利要求2所述的一种基于结构相似性度量的图像分割方法,其特征在于,对待分割原始图像或所述训练集进行预处理,包括:采用hsv拉伸方法增强图像对比度。4.根据权利要求1所述的一种基于结构相似性度量的图像分割方法,其特征在于,所述编码路径包括4个重复的结构相似性度量编码单元;所述解码路径包括与所述编码路径特征深度相同的3个重复的解码单元;将对应特征深度的所述结构相似性度量编码单元和所述解码单元进行串连;每个所述结构相似性度量编码单元包括2个卷积层、1个池化层和1个结构相似性权重计算模组;每个所述解码单元包括2个卷积层和1个转置卷积层。5.根据权利要求4所述的一种基于结构相似性度量的图像分割方法,其特征在于,在训练阶段,所述结构相似性权重计算模组执行以下步骤:遍历所述训练集原始图像子图的每个特征点位置处的特征点向量;利用全局池化层计算所述训练集原始图像子图的全局特征向量;计算所述训练集图像子图的全局特征向量和特征点向量间的结构相似性权重;将所述结构相似性权重加权到对应的特征点向量上,形成加权特征图;将所述训练集原始图像子图与所述加权特征图沿着特征通道的方向进行特征图堆叠。
6.根据权利要求5所述的一种基于结构相似性度量的图像分割方法,其特征在于,所述结构相似性权重的计算公式为:w
mn
=l(m,n)c(m,n)u(m,n)l(m,n)c(m,n)u(m,n)l(m,n)c(m,n)u(m,n)其中,w
mn
表示结构相似性权重;l(m,n)、c(m,n)和u(m,n)分表示m和n间的亮度、对比度和结构相似性;m表示原始图像子图的全局特征向量,通过全局平均池化实现,n表示原始图像子图中位于(x,y)处的特征点向量;μ
m
表示全局特征向量m的均值,μ
n
表示特征点向量n的均值;σ
m
表示全局特征向量m的标准差,σ
n
表示特征点向量n的标准差,σ
mn
表示m和n间的协方差;c1、c2、c3为常数项;所述加权特征图的计算公式为:n
′
=w
mn
n,其中,n
′
表示加权后的特征点向量。7.一种基于结构相似性度量的图像分割装置,其特征在于,包括:获取模块,用于获取基于机器视觉的待分割原始图像;预处理模块,用于对所述待分割原始图像进行预处理;图像分块模块,用于对预处理后的待分割原始图像进行分块操作,得到待分割原始图像子图;分割预测模块,用于采用如权利要求1-6任一项所述的训练好的u形分割网络对所述待分割原始图像子图进行分割,得到分割图像子图,并将属于同一原始待分割图像的各个所述分割图像子图按照分块顺序进行拼接,得到最终的分割图像。8.根据权利要求7所述的一种基于结构相似性度量的图像分割装置,其特征在于,所述预处理模块包括:rgb-hsv映射单元,用于将待分割原始图像从rgb色彩空间映射到hsv色彩空间;归一化单元,用于将hsv色彩空间的待分割原始图像的s通道和v通道进行最小-最大化归一化处理;映射单元,用于将待分割原始图像从hsv色彩空间重新映射回rgb色彩空间。9.根据权利要求7所述的一种基于结构相似性度量的图像分割装置,其特征在于,所述分割预测模块包括u形网络单元和子图拼接单元;所述u形网络单元包括:编码路径层、解码路径层和监督单元和损失函数单元;其中,所述编码路径层包括4个重复的结构相似性度量编码单元;每个所述结构相似性度量编码单元包括2个卷积层、1个池化层和1个结构相似性权重计算模组;所述解码路径层包括与所述编码路径层特征深度相同的3个重复的解码单元;对应特征深度的所述结构相似性度量编码单元和所述解码单元串连;每个所述解码单元包括2个
卷积层和1个转置卷积层;所述监督单元用于将待分割原始图像作为监督信息;所述子图拼接单元用于将属于同一所述待分割原始图像的分割子图像按照分块顺序进行拼接,得到最终的分割图像;所述损失函数单元用于在训练阶段对所述u形分割网络的参数进行优化。10.一种终端设备,其特征在于,包括至少一个处理器和与所述处理器通信连接的至少一个存储器;所述存储器存储有可被所述处理器执行的程序指令;所述处理器运行所述程序指令时,执行如权利要求1-6任一项所述的基于结构相似性度量的图像分割方法的步骤。
技术总结本发明公开了一种基于结构相似性度量的图像分割方法、装置及终端设备,方法包括:获取训练集,进行预处理和分块操作,得到训练集原始图像子图和训练集标注图像子图;构建包括编码路径和解码路径的U形分割网络;利用训练集原始图像子图和训练集标注图像子图对U形分割网络进行训练,将U形分割网络预测输出的训练集分割图像子图进行拼接获得完整的训练集分割图像,利用交叉熵损失函数最小化训练集分割图像子图和训练集标注图像子图间的差异;将预处理和分块后的待分割原始图像子图输入训练好的U形分割网络,对分割结果进行拼接,得到最终的分割图像。本发明通过对于特征点间的结构相似性的特征表达,显著提高图像分割的准确率和视觉效果。和视觉效果。和视觉效果。
技术研发人员:陈乔伊 陈昱帆 唐跃川 杨苏 王静 张怡然 李娟 赵泽蛟
受保护的技术使用者:重庆金美通信有限责任公司
技术研发日:2022.06.23
技术公布日:2022/11/1