路径规划和模型训练方法、系统、存储介质和机器人

专利2026-02-07  1


本发明涉及机器人领域,特别涉及一种路径规划和模型训练方法、系统、存储介质和机器人。


背景技术:

1、近年来,大语言模型在自然语言处理、对话系统、机器翻译等领域取得了显著进展。然而,尽管大语言模型在处理文本和语言任务方面具有出色的表现,但在理解和处理非语言信息,尤其是空间数据和图结构数据方面仍然面临着诸多挑战。地图数据作为一种重要的空间数据形式,广泛应用于导航、路径规划、地理信息系统等领域。传统的机器人导航系统通常使用二维占用栅格地图进行路径规划,但这种方法存在更新频率高、计算量大的问题,无法适应动态变化的环境。因此,需要提供一种路径规划和模型训练方法、系统、存储介质和机器人。


技术实现思路

1、本发明提供一种路径规划模型的训练方法。以解决现有技术中传统的路径规划方法在处理复杂地图数据时存在局限性,导致规划的路径精度受限的问题。

2、本发明提供的一种路径规划模型的训练方法,包括:获取真实路径集合、对应的导航指令集合及室内区域图集合;其中,所述室内区域图集合的各个区域图是将区域内的各个标记点作为节点,用边来连接各个相通的标记点,所述导航指令集合包括真实路径集合的起始标记点和终止标记点;从所述室内区域图集合中提取各个节点的连接关系,将连接关系与对应节点相关联,并删除所述室内区域图集合中所有的边,形成室内区域变体图集合;将所述室内区域变体图集合和所述导航指令集合输入至路径规划模型,基于所述室内区域变体图集合中的连接关系,以及所述导航指令集合的起始标记点和终止标记点,生成规划路径集合;根据所述规划路径集合和所述真实路径集合的差异度,更新所述路径规划模型的参数,得到训练好的路径规划模型;其中,所述路径规划模型为大语言模型。

3、于本发明一实施例中,所述从所述室内区域图集合中提取各个节点的连接关系,将连接关系与对应节点相关联,并删除所述室内区域图集合中所有的边,形成室内区域变体图集合,包括:从所述室内区域图集合中提取出所有的节点以及与节点相连的边;针对提取的每个节点:查找与当前节点相连的边,确定与当前节点直接相连的其他节点并生成连接关系,将连接关系存储在当前节点内部;从所述室内区域图集合中删除所有的边,形成室内区域变体图集合。

4、于本发明一实施例中,所述室内区域图集合是由初始室内区域图集合通过数据扩增获得,根据所述初始室内区域图集合得到所述室内区域图集合的过程为:获取初始室内区域图集合;将所述初始室内区域图集合中各标记点进行随机变换,生成新的标记点;使用新的标记点更新原有的标记点,且保持各标记点原有的连接关系不变,得到室内区域图集合。

5、于本发明一实施例中,所述根据所述规划路径集合和所述真实路径集合的差异度,更新所述路径规划模型的参数,得到训练好的路径规划模型,包括:计算所述规划路径集合和所述真实路径集合的差异度;根据计算的差异度,基于lora方法更新所述路径规划模型的参数,得到训练好的路径规划模型。

6、于本发明一实施例中,所述根据计算的差异度,基于lora方法更新所述路径规划模型的参数,得到训练好的路径规划模型,包括:将所述路径规划模型的权重矩阵进行矩阵分解,分解为第一低秩矩阵和第二低秩矩阵;判断计算的差异度是否小于预设的差异度阈值:若否,则根据计算的差异度,基于第一低秩矩阵和第二低秩矩阵更新权重矩阵;若是,则得到训练好的路径规划模型。

7、于本发明一实施例中,所述根据计算的差异度,基于第一低秩矩阵和第二低秩矩阵更新权重矩阵,包括:根据计算的差异度,依据反向传播算法,保持权重矩阵不变,更新第一低秩矩阵和第二低秩矩阵的参数;基于更新后的第一低秩矩阵和第二低秩矩阵,计算并更新权重矩阵。

8、于本发明一实施例中,还提供了一种路径规划方法,所述方法包括:获取待规划区域的室内区域图以及导航指令;其中,所述室内区域图是将区域内的各个标记点作为节点,用边连接各个相通的标记点,所述导航指令包括待规划区域的起始标记点和终止标记点;从所述室内区域图中提取各个节点的连接关系,将连接关系与对应节点相关联,并删除所述室内区域图中所有的边,形成室内区域变体图;将所述室内区域变体图和所述导航指令输入至权利要求1-6任一项所述路径规划模型的训练方法得到的路径规划模型中,基于所述室内区域变体图中的连接关系,以及所述导航指令的起始标记点和终止标记点,生成所述待规划区域内的规划路径。

9、于本发明一实施例中,还提供了一种路径规划模型的训练系统,所述系统包括:数据获取模块,用于获取真实路径集合、对应的导航指令集合及室内区域图集合;其中,所述室内区域图集合的各个区域图是将区域内的各个标记点作为节点,用边来连接各个相通的标记点,所述导航指令集合包括真实路径集合的起始标记点和终止标记点;变体生成模块,用于从所述室内区域图集合中提取各个节点的连接关系,将连接关系与对应节点相关联,并删除所述室内区域图集合中所有的边,形成室内区域变体图集合;规划路径生成模块,用于将所述室内区域变体图集合和所述导航指令集合输入至路径规划模型,基于所述室内区域变体图集合中的连接关系,以及所述导航指令集合的起始标记点和终止标记点,生成规划路径集合;参数更新模块,用于根据所述规划路径集合和所述真实路径集合的差异度,更新所述路径规划模型的参数,得到训练好的路径规划模型;其中,所述路径规划模型为大语言模型。

10、于本发明一实施例中,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行上述任一项所述的路径规划模型的训练方法。

11、于本发明一实施例中,还提供一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述任一项所述的路径规划模型的训练方法或上述所述的路径规划方法。

12、本发明提出的一种路径规划模型的训练方法、系统、设备及介质。通过从室内区域图集合中提取各个节点的连接关系,并将这些连接关系与对应节点相关联,保留了节点间的重要信息,删除所有边后,形成室内区域变体图集合,简化了图结构,更易于模型的处理和理解。通过将室内区域变体图集合和导航指令集合输入至路径规划模型。该模型基于变体图中的连接关系,以及导航指令的起始和终止标记点,生成规划路径集合,确保了路径规划模型能够准确理解并处理室内环境中的复杂连接关系,从而实现了高效、准确的路径规划。



技术特征:

1.一种路径规划模型的训练方法,其特征在于,所述训练方法包括:

2.根据权利要求1所述的路径规划模型的训练方法,其特征在于,所述从所述室内区域图集合中提取各个节点的连接关系,将连接关系与对应节点相关联,并删除所述室内区域图集合中所有的边,形成室内区域变体图集合,包括:

3.根据权利要求1所述的路径规划模型的训练方法,其特征在于,所述室内区域图集合是由初始室内区域图集合通过数据扩增获得,根据所述初始室内区域图集合得到所述室内区域图集合的过程为:

4.根据权利要求1所述的路径规划模型的训练方法,其特征在于,所述根据所述规划路径集合和所述真实路径集合的差异度,更新所述路径规划模型的参数,得到训练好的路径规划模型,包括:

5.根据权利要求4所述的路径规划模型的训练方法,其特征在于,所述根据计算的差异度,基于lora方法更新所述路径规划模型的参数,得到训练好的路径规划模型,包括:

6.根据权利要求5所述的路径规划模型的训练方法,其特征在于,所述根据计算的差异度,基于第一低秩矩阵和第二低秩矩阵更新权重矩阵,包括:

7.一种路径规划方法,其特征在于,所述方法包括:

8.一种路径规划模型的训练系统,其特征在于,所述系统包括:

9.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,当所述计算机程序被计算机的处理器执行时,使计算机执行权利要求1至6中任一项所述的路径规划模型的训练方法或权利要求7所述的路径规划方法。

10.一种机器人,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至6中任一项所述的路径规划模型的训练方法或权利要求7所述的路径规划方法。


技术总结
本发明提供一种路径规划和模型训练方法、系统、存储介质和机器人。训练方法包括:获取真实路径集合、对应的导航指令集合及室内区域图集合;从室内区域图集合中提取各个节点的连接关系,将连接关系与对应节点相关联,并删除室内区域图集合中所有的边,形成室内区域变体图集合;将室内区域变体图集合和导航指令集合输入至路径规划模型,基于室内区域变体图集合中的连接关系,以及导航指令集合的起始标记点和终止标记点,生成规划路径集合;根据规划路径集合和真实路径集合的差异度,更新路径规划模型的参数,得到训练好的路径规划模型。实现了高效、准确的路径规划。

技术研发人员:谢馥璟,师泽仁
受保护的技术使用者:上海科技大学
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-19636.html

最新回复(0)