本技术涉及计算机视觉领域,尤其是一种基于图像渲染的自监督前馈循环深度估计方法。
背景技术:
1、深度估计是计算机视觉的一个重要研究分支,其通过采集被测对象的图像并利用图像处理方法来提取被测对象的深度信息,提取得到的被测对象的深度信息能够反映被测对象与相机之间的距离,对于提取被测对象的几何信息以及实现三维场景重建都起着重要的作用。
2、目前的深度估计技术主要可以分为单目深度估计以及多目深度估计两大类:单目深度估计基于单个视点获取到的图像进行深度估计,易于操作和工业实现,但是提取得到的被测对象的深度信息准确度和精度不高。多目深度估计获取多个不同视点的多幅图像,然后利用特征匹配和视差计算等原理对计算不同图像对应点之间的位置偏差来共同进行深度估计被测对象的深度信息,常用的算法包括sad匹配算法、bm算法等等。多目深度估计相比于单目深度估计来说提取得到的被测对象的深度信息准确度和精度较高,但是也存在对环境依赖较高的问题,容易受到光照、物体表面纹理等因素的干扰,在诸如工业现场之类的复杂环境下也存在提取的被测对象的深度信息的准确度和精度不高的问题。
技术实现思路
1、本技术针对上述问题及技术需求,提出了一种基于图像渲染的自监督前馈循环深度估计方法,本技术的技术方案如下:
2、一种基于图像渲染的自监督前馈循环深度估计方法,该自监督前馈循环深度估计方法包括:
3、获取目标对象的原始图像并初始化参数预测网络的网络参数,利用参数预测网络对原始图像进行参数预测并输出空间位置预测结果和第一渲染参数,空间位置预测结果包括原始图像中每个像素点在世界坐标系下的预测空间坐标;
4、利用渲染算法按照第一渲染参数进行图像渲染得到第一重构图像,并计算原始图像与第一重构图像之间的图像重构误差;
5、按照预定坐标变换方式对第一渲染参数中的预测位置参数进行空间位置变换得到第二渲染参数,第一渲染参数中的预测位置参数是原始图像中各个像素点在相机坐标系下的预测坐标;
6、利用渲染算法按照第二渲染参数进行图像渲染得到第二重构图像,利用参数预测网络对第二重构图像进行参数预测并输出第三渲染参数;
7、根据第三渲染参数中的预测位置参数和第二渲染参数中的预测位置参数计算空间位置误差;
8、根据图像重构误差和空间位置误差计算得到对原始图像的深度估计损失,按照深度估计损失更新参数预测网络的网络参数直至达到预定精度要求时,根据对原始图像的空间位置预测结果得到目标对象的深度估计结果。
9、其进一步的技术方案为,第二重构图像与原始图像存在图像重叠区域,根据第三渲染参数中的预测位置参数和第二渲染参数中的预测位置参数计算空间位置误差,包括:
10、根据图像重叠区域内的像素点在第三渲染参数中和第二渲染参数中的预测位置参数计算空间位置误差。
11、其进一步的技术方案为,原始图像是通过单目视觉系统获取目标对象的单视点图像;根据图像重叠区域内的像素点在第三渲染参数中和第二渲染参数中的预测位置参数计算空间位置误差包括:
12、对于图像重叠区域内的每个像素点,计算第二渲染参数包括的像素点在相机坐标系下的预测位置参数p1与第三渲染参数包括的像素点在相机坐标系下的预测位置参数p1’之间的欧式距离,作为像素点的尺度误差;根据图像重叠区域中所有像素点的尺度误差得到空间位置误差。
13、其进一步的技术方案为,原始图像包括通过多目视觉系统获取到的在多个不同视点处的单视点图像;根据图像重叠区域内的像素点在第三渲染参数中和第二渲染参数中的预测位置参数计算空间位置误差包括:
14、对于原始图像中与任意一个与第二重构图像存在图像重叠区域的单视点图像,对于单视点图像与第二重构图像中的图像重叠区域内的每个像素点,计算第二渲染参数包括的像素点在相机坐标系下的预测位置参数p1与第三渲染参数包括的像素点在相机坐标系下的预测位置参数p1’之间的欧式距离,作为像素点的尺度误差;根据图像重叠区域中所有像素点的尺度误差得到单视点图像与第二重构图像的位置误差;
15、根据所有单视点图像与第二重构图像的位置误差得到空间位置误差。
16、其进一步的技术方案为,得到原始图像的深度估计结果包括:
17、当原始图像是通过单目视觉系统获取目标对象的单视点图像时,利用网络参数更新后的参数预测网络输出原始图像的空间位置预测结果,并根据空间位置预测结果得到目标对象的深度估计结果;
18、当原始图像包括通过多目视觉系统获取到的在多个不同视点处的单视点图像,利用网络参数更新后的参数预测网络输出原始图像中每个单视点图像的空间位置预测结果,根据各个单视点图像的空间位置预测结果以及不同单视点图像之间的位姿标定关系,得到目标对象的深度估计结果。
19、其进一步的技术方案为,得到原始图像的深度估计结果包括:利用网络参数更新后的参数预测网络输出原始图像中每个单视点图像的空间位置预测结果,根据各个单视点图像的空间位置预测结果以及不同单视点图像之间的位姿标定关系,得到目标对象的深度估计结果。
20、其进一步的技术方案为,根据图像重构误差和空间位置误差计算得到对原始图像的深度估计损失包括:
21、当原始图像是通过单目视觉系统获取目标对象的单视点图像时,对单视点图像的图像重构误差和单视点图像的空间位置误差按照各自的权重系数进行加权计算得到对原始图像的深度估计损失;
22、当原始图像包括通过多目视觉系统获取到的在多个不同视点处的单视点图像,对单视点图像的图像重构误差和单视点图像的空间位置误差按照各自的权重系数进行加权计算得到单视点图像的深度估计损失,综合对原始图像中所有单视点图像的深度估计损失,得到对原始图像的深度估计损失。
23、其进一步的技术方案为,使用的渲染算法为高斯泼溅算法。
24、其进一步的技术方案为,计算原始图像与第一重构图像之间的图像重构误差包括:
25、计算原始图像与第一重构图像的l1损失作为图像重构误差。
26、其进一步的技术方案为,按照预定坐标变换方式对第一渲染参数中的预测位置参数进行空间位置变换得到第二渲染参数,包括:
27、将第一渲染参数中的预测位置参数p进行空间位置变换至p1=p*r+t得到第二渲染参数中的预测位置参数p1,r为预定旋转矩阵,t为预定平移矩阵。
28、其进一步的技术方案为,参数预测网络基于cnn网络或transformer网络搭建得到。
29、本技术的有益技术效果是:
30、本技术公开了一种基于图像渲染的自监督前馈循环深度估计方法,该方法引入深度学习利用参数预测网络来预测渲染参数,并结合图像渲染利用渲染参数进行图像渲染,并且有效结合原始图像中的光度信息以及包含在光度信息中尺度信息,构造了包含图像重构误差和空间位置误差的深度估计损失用于对参数预测网络的自监督训练,从而可以提高深度估计的准确度和精度,且自监督前馈循环训练的方法无需依赖于大量的训练数据,在工业上易于实现。
31、该深度估计方法利用高斯泼溅算法进行图像渲染,得益于高斯泼溅的高精度和渲染速度,避免该深度估计方法受渲染算法本身误差干扰,进一步保证了深度估计的精度,且使得该深度估计方法的速度较快,减少深度估计耗时。另外该方法针对单目深度估计场景和多目深度估计场景都可以适用,适用范围广。
1.一种基于图像渲染的自监督前馈循环深度估计方法,其特征在于,所述自监督前馈循环深度估计方法包括:
2.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,所述第二重构图像与所述原始图像存在图像重叠区域,所述根据第三渲染参数中的预测位置参数和所述第二渲染参数中的预测位置参数计算空间位置误差,包括:
3.根据权利要求2所述的自监督前馈循环深度估计方法,其特征在于,所述原始图像是通过单目视觉系统获取所述目标对象的单视点图像;根据图像重叠区域内的像素点在第三渲染参数中和第二渲染参数中的预测位置参数计算空间位置误差包括:
4.根据权利要求2所述的自监督前馈循环深度估计方法,其特征在于,所述原始图像包括通过多目视觉系统获取到的在多个不同视点处的单视点图像;根据图像重叠区域内的像素点在第三渲染参数中和第二渲染参数中的预测位置参数计算空间位置误差包括:
5.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,得到所述原始图像的深度估计结果包括:
6.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,所述根据图像重构误差和空间位置误差计算得到对所述原始图像的深度估计损失包括:
7.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,使用的渲染算法为高斯泼溅算法。
8.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,所述计算所述原始图像与所述第一重构图像之间的图像重构误差包括:
9.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,按照预定坐标变换方式对所述第一渲染参数中的预测位置参数进行空间位置变换得到第二渲染参数,包括:
10.根据权利要求1所述的自监督前馈循环深度估计方法,其特征在于,所述参数预测网络基于cnn网络或transformer网络搭建得到。
