一种视觉定位方法、设备及存储介质与流程

专利2025-12-04 27

本申请涉及计算机视觉，特别是涉及一种视觉定位方法、设备及存储介质。

背景技术：

1、在mr/ar/vr技术中，为了更全方位的采集周围环境并进行视觉的三维建图，采用全景相机是一个较好的方法。全景图像适用于ar/vr技术，具有便利性、低成本等优势。可基于全景相机构建的三维地图，通过端侧设备获取环境图像，并与远程云服务器的数据库进行匹配，从而实现定位。现有的视觉定位方法虽然能够通过端侧设备获取环境图像，并与远程云服务器的数据库进行匹配，从而实现定位的目的，但环境图像仅限为全景图像，普通的平面图像无法与远程云服务器的数据库进行匹配。

技术实现思路

1、本申请的一个优势在于提供一种视觉定位方法，其能够根据平面图像，与远程云服务器的数据库进行匹配，从而实现定位的目的。

2、基于此，为了实现本申请的上述至少一优势或其他优点和目的，本申请提供了一种视觉定位方法，包括以下步骤：

3、获取待定位图像和相机参数；

4、提取该待定位图像的第一全局描述符；

5、将该第一全局描述符与预先存储的第二全局描述符进行比较，从预先设置的若干张子图像中检索出多张第一子图像，所述多张第一子图像的第二全局描述符与待定位图像的第一全局描述符的相似度满足预设条件，所述第二全局描述符是对各个子图像进行提取得到的全局描述符，所述子图像是基于预设数量n1对预先存储的每张全景图进行拆分得到的平面图，多个全景图共同构建得到三维视觉地图，所述三维视觉地图存储有每张全景图的位姿信息、全景图上包含空间3d信息的特征点；

6、根据所述多张第一子图像，确定与所述多张第一子图像相关联的m张全景图；

7、根据该相机参数，将该m张全景图拆分为与该待定位图像的水平视场角相同的n2张第二子图像，该第二子图像为平面图，所述第二子图像的特征点的表征信息中包含该特征点在所述三维视觉地图的空间3d信息；

8、将该n2张第二子图像与该待定位图像进行图像匹配，得到共同特征点集，所述特征点集中包括多个共同特征点，所述共同特征点为所述n2张第二子图像与所述待定位图像中均存在的特征点；

9、根据该共同特征点集求解pnp ，得到该待定位图像的最终位姿。

10、根据本申请的一个实施例，所述相机参数包括分辨率和相机内参矩阵。

11、根据本申请的一个实施例，所述子图像的平视场角=360°/n1。

12、根据本申请的一个实施例，提取该第一全局描述符和该第二全局描述符的过程均使用检索算法来提取全局描述符。

13、根据本申请的一个实施例，使用所述图像检索算法来提取全局描述符的过程为：通过一个预训练的卷积神经网络提取图像的局部特征，再利用 vlad 层将局部特征聚合成全局描述符。

14、根据本申请的一个实施例，该待定位图像的水平视场角=360°/n2。

15、根据本申请的一个实施例，将该n2张第二子图像与该待定位图像进行图像匹配，得到共同特征点集，所述特征点集中包括多个共同特征点，所述共同特征点为所述n2张第二子图像与所述待定位图像中均存在的特征点的过程具体为：

16、对所述n2张第二子图像与所述待定位图像均进行特征提取，分别得到n2张第二子图像的特征点，和所述待定位图像的特征点；

17、基于所述n2张第二子图像的特征点，和所述待定位图像的特征点，采用基于检测器的局部特征匹配算法，进行特征匹配，得到所述共同特征点集。

18、根据本申请的一个实施例，将该n2张第二子图像与该待定位图像进行图像匹配，得到共同特征点集，所述特征点集中包括多个共同特征点，所述共同特征点为所述n2张第二子图像与所述待定位图像中均存在的特征点的过程具体为：

19、基于所述n2张第二子图像与所述待定位图像，采用无检测器的特征匹配算法，进行特征匹配，得到所述共同特征点集。

20、根据本申请的另一方面，本申请进一步提供了一种设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述的视觉定位方法的步骤。

21、本申请还提供了一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的视觉定位方法的步骤。

22、本申请的有益效果：本申请提供了一种视觉定位方法，将预先存储的三维视觉地图中的每个全景图，拆分为预设数量的多个子图像，且所述子图像为平面图，为之后查找与待定位图像（为平面图像）存在相似度或关联关系的全景图的过程奠定了可比较的基础，解决了现有技术中无法将平面图与全景图进行比较的问题。之后，将待定位图像的第一全局描述符与多个子图像的第二全局描述符进行比较，根据第一全局描述符与第二全局描述符的相似度情况，筛选出与待定位图像具备一定相似度的多个第一子图像，该筛选步骤排除了与待定位图像差别大的子图像，减少了后续进行的进一步精确化的比较过程中的计算工作量。之后，将与筛选出的多张第一子图像相关联的m张全景图进行拆分，得到多张第二子图像，该第二子图像为平面图，且其拆分依据为根据相机参数，按照与该待定位图像的水平视场角进行拆分的，进一步为从多张第二子图像中筛选出待定位图像具备的共同特征点的过程奠定了比较基础，且提高了比较的准确度。之后将该n2张第二子图像与该待定位图像进行图像匹配，得到包括多个共同特征点的共同特征点集，所述共同特征点为所述n2张第二子图像与所述待定位图像中均存在的特征点；根据该特征点集求解pnp ，得到该待定位图像的最终位姿。

技术特征：

1.一种视觉定位方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的视觉定位方法，其特征在于，所述相机参数包括分辨率和相机内参矩阵。

3.根据权利要求1所述的视觉定位方法，其特征在于，所述子图像的水平视场角=360°/n1。

4.根据权利要求3所述的视觉定位方法，其特征在于，提取该第一全局描述符和该第二全局描述符的过程均使用检索算法来提取全局描述符。

5.根据权利要求4所述的视觉定位方法，其特征在于，使用所述图像检索算法来提取全局描述符的过程为：通过一个预训练的卷积神经网络提取图像的局部特征，再利用 vlad层将局部特征聚合成全局描述符。

6.根据权利要求1所述的视觉定位方法，其特征在于，该待定位图像的水平视场角=360°/n2。

7.根据权利要求1所述的视觉定位方法，其特征在于，将该n2张第二子图像与该待定位图像进行图像匹配，得到共同特征点集，所述特征点集中包括多个共同特征点，所述共同特征点为所述n2张第二子图像与所述待定位图像中均存在的特征点的过程具体为：

8.根据权利要求1所述的视觉定位方法，其特征在于，将该n2张第二子图像与该待定位图像进行图像匹配，得到共同特征点集，所述特征点集中包括多个共同特征点，所述共同特征点为所述n2张第二子图像与所述待定位图像中均存在的特征点的过程具体为：

9.一种设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至权利要求8中任一项所述的视觉定位方法的步骤。

10.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至权利要求8中任一项所述的视觉定位方法的步骤。

技术总结
本申请提供了一种视觉定位方法、设备及存储介质，其能够根据平面图像，与远程云服务器的数据库进行匹配，从而实现定位的目的。该视觉定位方法包括以下步骤：获取待定位图像和相机参数；提取该待定位图像的第一全局描述符；将该第一全局描述符与预先存储的第二全局描述符进行比较，从预先设置的若干张子图像中检索出多张第一子图像；根据所述多张第一子图像，确定与所述多张第一子图像相关联的M张全景图；根据该相机参数，将该M张全景图拆分为与该待定位图像的水平视场角相同的N2张第二子图像；将该N2张第二子图像与该待定位图像进行图像匹配，得到共同特征点集；根据该共同特征点集求解PnP，得到该待定位图像的最终位姿。

技术研发人员：曹卫,杨峰,孙凯,史春苓,陈科科
受保护的技术使用者：杭州秋果计划科技有限公司
技术研发日：
技术公布日：2024/11/11

转载请注明原文地址: https://tieba.8miu.com/read-18008.html

专利

最新回复(0)