基于视觉地图的定位方法及装置与流程

专利2022-12-26  111



1.本公开涉及计算机视觉技术领域,尤其涉及一种基于视觉地图的定位方法及装置。


背景技术:

2.视觉定位是依赖于视觉地图的定位方案,能够在卫星定位信号、蓝牙信号等受影响的环境下实现定位。视觉定位应用广泛,例如可以用于机器人、车辆等的定位及导航等。视觉定位包括基于视觉地图的定位,视觉地图完全基于连续时间流的构建方法生成。由于定位时采集的图像与生成视觉地图时采集的图像差异较大,导致同一位置的图像的特征差异也较大,最终导致定位不准确或定位失败。


技术实现要素:

3.本公开提供了一种基于视觉地图的定位方法及装置,以至少解决现有技术中存在的以上技术问题。
4.根据本公开的第一方面,提供了一种基于视觉地图的定位方法,所述方法包括:
5.获取目标对象周围环境的至少一个图像;
6.对获取的所述图像进行预处理;
7.确定与预处理后的所述图像对应的至少一个视觉特征定位图库,所述视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,不同的视觉特征定位图库对应不同的环境场景;
8.根据所述图像与对应的所述视觉特征定位图库的匹配结果,确定所述目标对象的位置。
9.在一可实施方式中,确定与预处理后的所述图像对应的至少一个视觉特征定位图库,包括:
10.确定预处理后的所述图像的环境场景;
11.根据所述图像的所述环境场景与所述视觉特征定位图库对应的环境场景的匹配结果,确定与所述图像对应的视觉特征定位图库。
12.在一可实施方式中,确定预处理后的所述图像的环境场景,包括:
13.提取预处理后的所述图像的图像描述;
14.根据所述图像描述确定所述图像的环境场景。
15.在一可实施方式中,所述视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,包括:
16.获取同一地理位置的多个环境场景的图像集合;
17.提取所述图像集合中每一图像的图像描述;
18.根据所述图像描述,对所述图像集合中的图像进行聚类,得到多组图像,每一组图像对应一个环境场景的视觉特征定位图库。
19.在一可实施方式中,获取同一地理位置的多个环境场景的图像集合,包括:
20.采集不同环境场景的视频流数据,并同步采集地理位置数据;
21.将不同环境场景的视频流数据分别与同步采集的地理位置数据匹配,得到与地理位置对应的图像;
22.根据匹配结果,获取与同一地理位置对应的图像集合。
23.在一可实施方式中,提取所述图像集合中每一图像的图像描述,包括:
24.将所述图像分为多个子图;
25.将动态障碍物所在的子图删除,获取剩余的各子图的图像描述;
26.对各子图的图像描述进行合并,通过hash运算生成所述图像的图像描述。
27.根据本公开的第二方面,提供了一种基于视觉地图的定位装置,所述装置包括:
28.获取模块,用于获取目标对象周围环境的至少一个图像;
29.预处理模块,用于对获取的所述图像进行预处理;
30.确定模块,用于确定与预处理后的所述图像对应的至少一个视觉特征定位图库,所述视觉特征定位图库根据环境场景划分,不同的视觉特征定位图库对应不同的环境场景;
31.定位模块,用于根据所述图像与对应的所述视觉特征定位图库的匹配结果,确定所述目标对象的位置。
32.根据本公开的第三方面,提供了一种电子设备,包括:
33.至少一个处理器;以及
34.与所述至少一个处理器通信连接的存储器;其中,
35.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
36.根据本公开的第四方面,提供了一种车辆,所述车辆包括上述实施例的电子设备。
37.根据本公开的第五方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
38.本公开的基于视觉地图的定位方法中,将获取的目标对象周围环境的至少一个图像进行预处理后,确定与预处理后的图像对应的至少一个视觉特征定位图库,根据预处理后的图像与对应的视觉特征定位图库的匹配结果,可以确定目标对象的位置,本公开实施例中的视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,不同的视觉特征定位图库对应不同的环境场景,目标对象周围环境的图像与对应的视觉特征定位图库中的图像的环境场景相同或相近,同一位置的图像的特征差异较小,目标对象周围环境的图像与对应的视觉特征定位图库进行匹配,可以提高定位的准确性,降低定位不准确或定位失败概率。视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,定位时可以直接将目标对象周围环境的图像匹配到对应的视觉特征定位图库,简单方便,适应性强。
39.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
40.通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目
的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
41.在附图中,相同或对应的标号表示相同或对应的部分。
42.图1示出了本公开实施例基于视觉地图的定位方法的实现流程示意图;
43.图2示出了本公开实施例基于视觉地图的定位装置的组成结构示意图;
44.图3示出了本公开实施例一种电子设备的组成结构示意图。
具体实施方式
45.为使本公开的目的、特征、优点能够更加的明显和易懂,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而非全部实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
46.根据本公开的实施例,本公开提供了一种基于视觉地图的定位方法,参见图1,本公开实施例的基于视觉地图的定位方法包括:获取目标对象周围环境的至少一个图像;对获取的图像进行预处理;确定与预处理后的图像对应的至少一个视觉特征定位图库,视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,不同的视觉特征定位图库对应不同的环境场景;根据图像与对应的视觉特征定位图库的匹配结果,确定目标对象的位置。
47.本公开实施例中,将获取的目标对象周围环境的至少一个图像进行预处理后,确定与预处理后的图像对应的至少一个视觉特征定位图库,根据预处理后的图像与对应的视觉特征定位图库的匹配结果,可以确定目标对象的位置,本公开实施例中的视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,不同的视觉特征定位图库对应不同的环境场景,目标对象周围环境的图像与对应的视觉特征定位图库中的图像的环境场景相同或相近,同一位置的图像的特征差异较小,目标对象周围环境的图像与对应的视觉特征定位图库进行匹配,可以提高定位的准确性,降低定位不准确或定位失败概率。视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,定位时可以直接根据目标对象周围环境的图像匹配到对应的视觉特征定位图库,简单方便,适应性强。
48.本公开实施中,目标对象周围环境的图像的获取方式不限,根据具体的应用场景,可以是实时获取目标对象周围环境的至少一个图像,也可以是预先获取目标对象周围环境的至少一个图像。本公开实施例中的视觉特征定位图库是基于对采集的多个环境场景的图像聚类得到,因此,定位时可以直接根据目标对象周围环境的图像匹配到对应的视觉特征定位图库,无需其他信息,对本公开实施例的方法的应用没有额外的要求,适应性强,可以广泛用于车辆、机器人以及电子设备等。例如,本公开实施例的方法应用于车辆或机器人的导航时,目标对象为车辆或机器人,通过车辆或机器人上的摄像头实时获取周围环境的图像,可以对车辆或机器人进行实时定位和导航。或者,本公开实施例的方法应用于根据已有图像对图像中的店铺进行定位时,目标对象为图像中的店铺,该图像则为预先获得的图像。
49.本公开实施例中,对获取的图像进行预处理可以使图像更易于识别,与视觉特征定位图库进行匹配更准确,提高定位的准确性。对获取的图像进行预处理可以包括但不限于图像增强、图像滤波、图像分割、图像拉伸、边缘检测、动态障碍物去除等。具体实施中,可以根据图像质量、需求等选择预处理方案及具体的处理顺序等。
50.本公开实施例中,环境场景可以是根据不同时间、不同气候以及不同交通流等进行划分。一天的不同时段,由于光线等因素同一位置的图像特征可能存在较大差异,如果生成视觉特征定位图库时,不加以区分,定位时采集图像的时间与生成视觉特征定位图库的图像的时间不同,使图像的特征差异较大,可能造成定位不准或定位失败。例如,生成视觉特征定位图库的图像的采集时间为中午,而目标对象周围环境的图像采集的时间为傍晚,由于光线强度,光线角度等的变化,都可能导致同一位置的图像的特征差异较大。另外,即使在同一时间,由于气候、交通流等因素,也可能导致同一位置的图像的特征差异较大。对于晴天、雨天、雾天等不同气候条件下,同一位置的图像的特征差异会对视觉定位的准确性造成影响。对于不同交通流,移动物体的多少会对环境产生不同的影响,移动物体越多引入的特征越多,因此不同的交通流会导致同一位置的图像的特征的差异较大。当然,环境场景的划分不限于依据不同时间、不同气候以及不同交通流。
51.在一可实施方式中,确定与预处理后的图像对应的至少一个视觉特征定位图库,包括:确定预处理后的图像的环境场景。本公开实施例的方法采用的视觉特征定位图库是根据不同的环境场景划分,根据图像的环境场景即可确定对应的至少一个视觉特征定位图库。当然,本公开并不排除其他确定至少一个对应的视觉特征定位图库的方式。
52.本公开实施例中,根据图像的环境场景确定对应的至少一个视觉特征定位图库,可以是通过图像的环境场景与视觉特征定位库对应的环境场景进行匹配,根据图像的环境场景与视觉特征定位图库对应的环境场景的匹配结果,确定与图像对应的视觉特征定位图库。目标对象周围环境的图像的环境场景为阴天时,将其与视觉特征定位图库的环境场景进行匹配,当匹配到阴天的环境场景时,则确定与阴天的环境场景对应的视觉特征定位图库作为定位用视觉特征定位图库。具体实施时,不同的环境场景可以用参数进行标记。例如,根据不同时间或不同气候划分的环境场景可以用光度参数标记,当然也可以用光度、光比等多个参数进行标记。根据不同交通流划分的环境场景可以用活动障碍占比等进行标记。对于同时根据不同时间和不同交通流划分的环境场景可以采用光度、活动障碍占比共同标记。具体通过标记环境场景的参数匹配实现视觉特征定位图库的确定。不同的确定的视觉特征定位图库可以是一个,也可以是多于一个。
53.在一可实施方式中,确定预处理后的图像的环境场景,包括:提取预处理后的图像的图像描述;根据图像描述确定图像的环境场景。提取的图像描述可以是针对环境场景的特征的描述。具体的,可以是根据图像描述与各环境场景的距离来确定图像的环境场景。例如,用聚类模型计算图像描述与各环境场景的距离,图像的图像描述与某一环境场景的距离小于阈值时,则确定该环境场景为图像的环境场景。
54.本公开实施例中,提取图像描述包括但不限于:基于sift(尺度不变特征变换,scale-invariant feature transform)、基于surf或基于orb的词袋描述提取图像描述,或者基于hash的图像指纹提取图像描述。
55.本公开实施例中,确定与预处理后的图像对应的至少一个视觉特征定位图库,也可以是响应图库选择操作,确定与预处理后的图像对应的至少一个视觉特征定位图库。具体的,用户通过输入输出设备或触控操作等选择视觉特征定位图库,根据用户的选择,将用户选中的视觉特征定位图库作为用于与预处理后的图像进行匹配实现定位的视觉特征定位图库。用户可以是通过菜单进行选择,也可以是本公开方法显示图库展示窗口,图库展示
窗口显示可选择的视觉特征定位图库,用户通过点击、划线、画圈等操作选择相应的视觉特征定位图库。
56.在一可实施方式中,视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,包括:获取同一地理位置的多个环境场景的图像集合;提取图像集合中每一图像的图像描述;根据图像描述,对图像集合中的图像进行聚类,得到多组图像,每一组图像对应一个环境场景的视觉特征定位图库。每个环境场景的图像可以是一个,也可以是多个。例如,对于经纬度为(x,y)这一地理位置,可以对应有阴天环境场景、晴天环境场景、雨天环境场景、黄昏环境场景、凌晨环境场景等多个环境场景的图像。提取每一图像的图像描述后,根据图像描述对图像集合进行聚类即可实现图像到对应的视觉特征定位图库的自动划分,较直接按照时间、气候、光照等条件进行地图库的划分更准确。具体实施中,可以使用knn聚类方法(k-nearest neighbor,k近邻算法)对图像集合中的图像进行分类,knn聚类方法通过聚类后,可以输出多个视觉特征定位库,实现不同环境场景的视觉特征定位库的自动划分。根据图像描述聚类得到的视觉特征定位图库较人为划分能够更准确地划分不同的环境场景,提高定位准确性。且定位时,可以根据目标对象周围环境的图像直接匹配到对应的视觉特征定位图库,无需其他信息,无需额外的信息采集设备,适用性高。
57.本公开实施例中,在提取图像集合中每一图像的图像描述之前,对图像集合中的图像进行预处理,具体的,可参考上述关于预处理的描述,在此不再赘述。
58.在一可实施方式中,获取同一地理位置的多个环境场景的图像集合,包括:采集不同环境场景的视频流数据,并同步采集地理位置数据;将不同环境场景的视频流数据分别与同步采集的地理位置数据匹配,得到与地理位置对应的图像;根据匹配结果,获取与同一地理位置对应的图像集合。在采集视频流数据的同时,同步采集地理位置数据,地理位置数据可以通过gps、北斗等卫星定位系统获得。由于二者同步采集,因此基于时间匹配可以实现视频流数据与地理位置数据的对应。视频流数据与地理位置数据的对应可以得到与地理位置对应的图像。例如,对于环境场景一采集的视频流数据和同步采集的地理位置数据,2021年7月13日08时45分55秒的时间点,地理位置数据对应的经纬度为(x1,y1),视频流对应的图像为im1,视频流与地理位置匹配后可以得到(x1,y1)-im1的对应关系。2021年7月13日08时45分56秒的时间点,地理位置数据对应的经纬度为(x2,y2),视频流对应的图像为im2,视频流与地理位置匹配后可以得到(x2,y2)-im2的对应关系。同样,对于其他环境场景同步采集的视频流数据和地理位置数据基于时间匹配后,也能够得到地理位置(如经纬度)与图像的对应数据。对于同一地理位置,每一环境场景至少对应有一个图像,多个环境场景的与同一地理位置对应的图像即可构成一个集合。例如,对于地理位置(xa,ya)可以对应的图像可以有p1、p2、p3、

、pn。
59.在一可实施方式中,提取图像集合中每一图像的图像描述,包括:将图像分为多个子图;将动态障碍物所在的子图删除。本公开实施例中,先将图像分为多个子图,然后将影响图像特征提取的包括动态障碍物的子图删除,可以快速去除图像中的动态障碍物,避免动态障碍物对图像所在位置的真实环境的特征提取造成影响。具体实施中,将动态障碍物所在的子图删除可以是根据动态障碍物的面积占所在子图的百分比确定。例如,动态障碍物的面积占所在子图的百分比达到阈值时,删除该子图。具体阈值的设置可以是5%、10%、20%、30%、50%、70%、80%等。提取图像集合中每一图像的图像描述,还包括:获取剩余的
各子图的图像描述;对各子图的图像描述进行合并,通过hash运算生成图像的图像描述。本公开实施例中,将图像分为多个子图,分别获取各子图的图像描述,然后再将各子图的图像描述合并得到整个图像的图像描述,更灵活,方便。具体的,通过hash运算生成图像的图像描述。可以用hash表对各子图的图像描述进行管理、合并,能够解决不同位置子图序列长度不同的问题。
60.参见图2,根据本公开的实施例,本公开提供了一种基于视觉地图的定位装置,该装置包括获取模块、预处理模块、确定模块和定位模块,获取模块用于获取目标对象周围环境的至少一个图像;预处理模块用于对获取的图像进行预处理;确定模块用于确定与预处理后的图像对应的至少一个视觉特征定位图库,视觉特征定位图库根据环境场景划分,不同的视觉特征定位图库对应不同的环境场景;定位模块用于根据图像与对应的视觉特征定位图库的匹配结果,确定目标对象的位置。
61.本公开实施例的基于视觉地图的定位装置中,预处理模块将获取模块获取的目标对象周围环境的至少一个图像进行预处理后,定位模块确定与预处理后的图像对应的至少一个视觉特征定位图库,定位模块根据预处理后的图像与对应的视觉特征定位图库的匹配结果,可以确定目标对象的位置,本公开实施例中的视觉特征定位图库根据环境场景划分,不同的视觉特征定位图库对应不同的环境场景,目标对象周围环境的图像与对应的视觉特征定位图库中的图像的环境场景相同或相近,同一位置的图像的特征差异较小,目标对象周围环境的图像与对应的视觉特征定位图库进行匹配,可以提高定位的准确性,降低定位不准确或定位失败概率。
62.本公开实施例中,预处理模块对获取的图像进行预处理可以使图像更易于识别,与视觉特征定位图库进行匹配更准确,提高定位的准确性。预处理模块对获取的图像进行预处理可以包括但不限于图像增强、图像滤波、图像分割、图像拉伸、边缘检测、动态障碍物去除等。具体实施中,可以根据图像质量、需求等选择预处理方案及具体的处理顺序等。
63.在一可实施方式中,确定模块确定与预处理后的图像对应的至少一个视觉特征定位图库,包括:确定预处理后的图像的环境场景;根据图像的环境场景与视觉特征定位图库对应的环境场景的匹配结果,确定与图像对应的视觉特征定位图库。
64.在一可实施方式中,确定模块包括提取单元和确定单元,提取单元用于提取预处理后的图像的图像描述;确定单元用于根据图像描述确定图像的环境场景。
65.本公开实施例中,提取单元可以基于特征提取模型提取图像的图像描述,具体的,包括但不限于:基于sift(尺度不变特征变换,scale-invariant feature transform)、基于surf或基于orb的词袋描述提取图像描述,或者基于hash的图像指纹提取图像描述。
66.在一可实施方式中,确定模块确定与预处理后的图像对应的至少一个视觉特征定位图库,也可以是响应图库选择操作,确定与预处理后的图像对应的至少一个视觉特征定位图库。具体的,用户通过输入输出设备或触控操作等选择视觉特征定位图库,根据用户的选择,将用户选中的视觉特征定位图库作为用于与预处理后的图像进行匹配实现定位的视觉特征定位图库。用户可以是通过菜单进行选择,也可以是本公开方法显示图库展示窗口,图库展示窗口显示可选择的视觉特征定位图库,用户通过点击、划线、画圈等操作选择相应的视觉特征定位图库。
67.在一可实施方式中,视觉特征定位图库根据环境场景划分,包括:获取同一地理位
置的多个环境场景的图像集合;提取图像集合中每一图像的图像描述;根据图像描述,对图像集合中的图像进行分类,得到多组图像,每一组图像对应一个环境场景的视觉特征定位图库。
68.在一可实施方式中,在提取图像集合中每一图像的图像描述之前,对图像集合中的图像进行预处理,具体的,可参考上述关于预处理的描述,在此不再赘述。
69.在一可实施方式中,获取同一地理位置的多个环境场景的图像集合,包括:采集不同环境场景的视频流数据,并同步采集地理位置数据;将不同环境场景的视频流数据分别与同步采集的地理位置数据匹配,得到与地理位置对应的图像;根据匹配结果,获取与同一地理位置对应的图像集合。
70.在一可实施方式中,提取图像集合中每一图像的图像描述,包括:将图像分为多个子图;将动态障碍物所在的子图删除;分别获取各子图的图像描述,通过hash运算生成图像的图像描述。
71.本公开实施例的基于视觉地图的定位装置能够实现上述各实施例的方法,上述各方法实施例的描述均可用于理解和解释本公开实施例的装置。出于简洁和节省篇幅的目的,在此不再赘述。
72.根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。本公开实施例的电子设备能够执行本公开所述的方法。
73.根据本公开的实施例,本公开还提供了一种车辆,该车辆包括上述实施例的电子设备。该电子设备包括车载终端和易于移动的独立的电子设备。
74.图3示出了可以用来实施本公开的实施例的示例电子设备300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
75.如图3所示,设备300包括计算单元301,其可以根据存储在只读存储器(rom)302中的计算机程序或者从存储单元308加载到随机访问存储器(ram)303中的计算机程序,来执行各种适当的动作和处理。在ram 303中,还可存储设备300操作所需的各种程序和数据。计算单元301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
76.设备300中的多个部件连接至i/o接口305,包括:输入单元306,例如键盘、鼠标等;输出单元307,例如各种类型的显示器、扬声器等;存储单元308,例如磁盘、光盘等;以及通信单元309,例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
77.计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理,例如基于视觉地图的定位方法。例如,在一些实施例中,基于视觉地图的定位方法可被实现
为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元308。在一些实施例中,计算机程序的部分或者全部可以经由rom 302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到ram 303并由计算单元301执行时,可以执行上文描述的基于视觉地图的定位方法的一个或多个步骤。备选地,在其他实施例中,计算单元301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于视觉地图的定位方法。
78.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
79.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
80.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
81.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
82.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
83.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
84.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
85.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
86.以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。

技术特征:
1.一种基于视觉地图的定位方法,其特征在于,所述方法包括:获取目标对象周围环境的至少一个图像;对获取的所述图像进行预处理;确定与预处理后的所述图像对应的至少一个视觉特征定位图库,所述视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,不同的视觉特征定位图库对应不同的环境场景;根据所述图像与对应的所述视觉特征定位图库的匹配结果,确定所述目标对象的位置。2.根据权利要求1所述的方法,其特征在于,确定与预处理后的所述图像对应的至少一个视觉特征定位图库,包括:确定预处理后的所述图像的环境场景;根据所述图像的所述环境场景与所述视觉特征定位图库对应的环境场景的匹配结果,确定与所述图像对应的视觉特征定位图库。3.根据权利要求2所述的方法,其特征在于,确定预处理后的所述图像的环境场景,包括:提取预处理后的所述图像的图像描述;根据所述图像描述确定所述图像的环境场景。4.根据权利要求1所述的方法,其特征在于,所述视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,包括:获取同一地理位置的多个环境场景的图像集合;提取所述图像集合中每一图像的图像描述;根据所述图像描述,对所述图像集合中的图像进行聚类,得到多组图像,每一组图像对应一个环境场景的视觉特征定位图库。5.根据权利要求4所述的方法,其特征在于,获取同一地理位置的多个环境场景的图像集合,包括:采集不同环境场景的视频流数据,并同步采集地理位置数据;将不同环境场景的视频流数据分别与同步采集的地理位置数据匹配,得到与地理位置对应的图像;根据匹配结果,获取与同一地理位置对应的图像集合。6.根据权利要求4所述的方法,其特征在于,提取所述图像集合中每一图像的图像描述,包括:将所述图像分为多个子图;将动态障碍物所在的子图删除,获取剩余的各子图的图像描述;对各子图的图像描述进行合并,通过hash运算生成所述图像的图像描述。7.一种基于视觉地图的定位装置,其特征在于,所述装置包括:获取模块,用于获取目标对象周围环境的至少一个图像;预处理模块,用于对获取的所述图像进行预处理;确定模块,用于确定与预处理后的所述图像对应的至少一个视觉特征定位图库,所述视觉特征定位图库根据环境场景划分,不同的视觉特征定位图库对应不同的环境场景;
定位模块,用于根据所述图像与对应的所述视觉特征定位图库的匹配结果,确定所述目标对象的位置。8.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。9.一种车辆,其特征在于,包括权利要求8所述的电子设备。10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。

技术总结
本公开提供了一种基于视觉地图的定位方法及装置,所述方法包括:获取目标对象周围环境的至少一个图像;对获取的所述图像进行预处理;确定与预处理后的所述图像对应的至少一个视觉特征定位图库,所述视觉特征定位图库基于对采集的多个环境场景的图像聚类得到,不同的视觉特征定位图库对应不同的环境场景;根据所述图像与对应的所述视觉特征定位图库的匹配结果,确定所述目标对象的位置。本公开的基于视觉地图的定位方法能够适应不同环境场景下的定位,提高定位的准确性。提高定位的准确性。提高定位的准确性。


技术研发人员:陶圣 李春里 赵宏峰 李雪健 朱江林
受保护的技术使用者:上海励驰半导体有限公司
技术研发日:2022.07.26
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-46.html

最新回复(0)