一种具身智能机器人的通用系统的制作方法

专利2026-06-27  1


本发明属于智能机器人,具体涉及一种具身智能机器人的通用系统。


背景技术:

1、具身智能机器人是人工智能领域的一个重要发展方向,它们以具身智能理论为指导,融合了成熟的工业机器人技术与新兴的人工智能技术。具身智能机器人是指能够通过感知和交互与环境进行实时互动的智能系统或机器。它们不仅具备高精度的自适应感知系统,还能自主决策及自动执行各种任务。这种机器人以“身体”为载体,通过感知和行动来理解和适应环境,实现了智能与机体的深度融合。具身智能机器人包括如下部分:1.感知系统:采用多模态泛传感器系统,能够连续、不间断地感知周边环境及机器人自身的状态,为决策提供精准的信息。2.运动系统:基于闭环控制系统,结合动力学和运动学算法,实现高精度的运动控制。例如,通过“视觉伺服”系统实现对机器人运动轨迹的精确规划和调整。3.世界模型:智能体根据自身结构特点构建起来、用于解释世界的认知框架。它是动态变化的,每一次与环境的互动都会对其产生影响。

2、现有的具身智能机器人存在以下问题:1.运动控制不够成熟。具身智能机器人在运动控制方面还存在挑战,难以实现高度灵活和精准的运动。这主要是因为现有的运动控制算法和机械结构尚无法完全模拟人类的灵活性和精确度,导致机器人在执行复杂任务时可能受限。2.感知与识别能力有限。尽管机器人配备了多种感知器官(如摄像头、激光雷达、触觉传感器等),但其对动态环境的感知和识别能力仍不够强。这限制了机器人在复杂、多变环境中的应用能力。3.人机交互界面不够友好。目前的人机交互方式虽然取得了一定的进展,但仍有待优化。例如,自然语言处理技术尚未完全成熟,使得机器人在理解人类语言时可能出现误解;同时,机器人缺乏情感交流能力,难以像人类一样进行自然而流畅的对话。

3、因此,本方案提供一种具身智能机器人的通用系统用于解决上述背景技术存在的部分问题。


技术实现思路

1、针对上述背景技术所提出的问题,本发明的目的是:旨在提供一种具身智能机器人的通用系统,

2、为实现上述技术目的,本发明采用的技术方案如下:

3、一种具身智能机器人的通用系统,所述通用系统包括核心神经网络和本体设备,所述核心神经网络包括大语言模块、记忆模块、感知模块和运动控制模块,所述本体设备包括驱动系统、机械系统和传感器系统;

4、所述大语言模块用于接收用户通过自然语言对话下达的交互任务,并向用户发送反馈确认信息;所述大语言模块还用于生成运动规划信息,并将该运动规划信息发送至运动控制模块;所述反馈确认信息包括感知信息;所述大语言模块采用bert系列、gpt-3系列或gpt-4系列中的任一种语言模型;

5、所述记忆模块负责存储和检索与交互任务相关联的知识信息,所述知识信息包括经验信息;

6、所述感知模块用于接收大语言模块发送的感知信息请求,并返回相对应的感知信息,所述感知模块融合多种感知方式,用于环境进行全面感知;

7、所述运动控制模块用于根据大语言模块生成的规划信息、结合记忆模块存储和检索的知识信息和感知模块提供的感知信息,生成控制指令,并将控制质量发送给本体设备中的驱动系统;所述运动控制模块采用模型预测控制mpc、全身控制wbc和多模态感知融合中任一种关键技术;

8、所述驱动系统用于接收运动控制模型发送的控制指令,并生成相应的控制信号;

9、所述机械系统包括机器人,所述机器人上设有多个关节和部件,所述机械系统用于接收驱动系统发出的控制信号,再根据控制信号驱动机器人的各个关节和部件;

10、所述传感器系统用于实时采集环境中的感知信息,并将此信息发送给感知模块进行处理。

11、进一步限定,所述感知模块的多种感知方式包括视觉感知、听觉感知和触觉感知。

12、进一步限定,所述大语言模块采用自然语言处理的nlp算法进行理解用户指令的关键之处,所述nlp算法中包括词嵌入功能和注意力机制功能,所述词嵌入功能用于将自然语言中的单词或短语转换为高维空间中的向量表示,将转换后的结果发送至计算机进行处理;所述注意力机制功能用于在帮助语言模型在生成输出序列时,更加关注输入序列中的相关部分。

13、进一步限定,所述词嵌入功能基于神经网络模型word2vec或者glove实现。

14、进一步限定,所述注意力机制功能基于seq2seq模型中实现。

15、进一步限定,所述模型预测控制mpc基于已知的系统模型进行预测,所述模型预测控制mpc的状态空间模型表达式为:

16、xk+1=axk+buk

17、其中xk是系统在时间步k的状态向量,uk是在时间步k的控制输入向量,a是状态转移矩阵,b是输入矩阵;

18、还包括输出表达式:

19、yk=cxk+duk

20、yk是在时间k的输出向量,c是输出矩阵,d是直接传递矩阵。

21、进一步限定,所述模型预测控制mpc通过预测未来多个时间步的系统输出来进行优化;假设在时刻k,预测未来n步的状态和控制输入,可以表示为:

22、xk+1=axk+buk;

23、xk+2=axk+1+buk+1=a2xk+abuk+buk+1;

24、xk+n=anxk+an-1buk+…+buk+n-1;

25、其中a是状态转移矩阵,b是输入矩阵,xk+1是系统在时间步k+1的状态向量,xk+2是系统在时间步k+2的状态向量,xk+n是系统在时间步k+n的状态向量。

26、进一步限定,所述模型预测控制mpc通过最小化一个代价函数来确定最优控制输入序列,所述代价函数包括状态误差和控制输入的加权和,所述状态跟踪误差用于衡量实际状态与目标状态之间的差距,所述控制输入用于控制输入的大小,其表达式如下:

27、

28、其中n是预测时域长度,q是状态误差权重矩阵,r是控制输入权重矩阵,p是终端状态权重矩阵。

29、本发明的有益效果:

30、本方案提供了一种具身智能机器人的通用系统,相较于现有技术的机器人运动控制不够成熟,难以实现高度灵活和精准的运动,主要因为现有的运动控制算法和机械结构尚无法完全模拟人类的灵活性和精确度,导致机器人在执行复杂任务时可能受限;本方案的大语言模块接收用户通过自然语言对话下达的交互任务,记忆模块存储和检索与交互任务相关联的知识信息,感知模块对环境进行全面感知;运动控制模块根据大语言模块生成的规划信息、结合记忆模块存储和检索的知识信息和感知模块提供的感知信息,生成控制指令,并将控制质量发送给机器人,从而实现机器人在现实环境中的人机交互;此外,运动控制模块通过采用模型预测控制mpc,模型预测控制mpc通过预测未来系统行为来做出决策,在每个时间步骤中解决一个最优化问题,以寻找控制输入,以最小化成本并满足约束,非常适合在需要高精度和动态调整的使用场景中,通用性强,实用性好。



技术特征:

1.一种具身智能机器人的通用系统,其特征在于:所述通用系统包括核心神经网络和本体设备,所述核心神经网络包括大语言模块(1)、记忆模块(2)、感知模块(3)和运动控制模块(4),所述本体设备包括驱动系统(5)、机械系统(6)和传感器系统(7);

2.根据权利要求1所述的一种具身智能机器人的通用系统,其特征在于:所述感知模块(3)的多种感知方式包括视觉感知、听觉感知和触觉感知。

3.根据权利要求1所述的一种具身智能机器人的通用系统,其特征在于:所述大语言模块(1)采用自然语言处理的nlp算法进行理解用户指令的关键之处,所述nlp算法中包括词嵌入功能和注意力机制功能,所述词嵌入功能用于将自然语言中的单词或短语转换为高维空间中的向量表示,将转换后的结果发送至计算机进行处理;所述注意力机制功能用于在帮助语言模型在生成输出序列时,更加关注输入序列中的相关部分。

4.根据权利要求3所述的一种具身智能机器人的通用系统,其特征在于:所述词嵌入功能基于神经网络模型word2vec或者glove实现。

5.根据权利要求3所述的一种具身智能机器人的通用系统,其特征在于:所述注意力机制功能基于seq2seq模型中实现。

6.根据权利要求1所述的一种具身智能机器人的通用系统,其特征在于:所述模型预测控制mpc基于已知的系统模型进行预测,所述模型预测控制mpc的状态空间模型表达式为:

7.根据权利要求6所述的一种具身智能机器人的通用系统,其特征在于:所述模型预测控制mpc通过预测未来多个时间步的系统输出来进行优化;假设在时刻k,预测未来n步的状态和控制输入,可以表示为:

8.根据权利要求6所述的一种具身智能机器人的通用系统,其特征在于:所述模型预测控制mpc通过最小化一个代价函数来确定最优控制输入序列,所述代价函数包括状态误差和控制输入的加权和,所述状态跟踪误差用于衡量实际状态与目标状态之间的差距,所述控制输入用于控制输入的大小,其表达式如下:


技术总结
本发明公开了一种具身智能机器人的通用系统,包括核心神经网络和本体设备,核心神经网络包括大语言模块、记忆模块、感知模块和运动控制模块,本体设备包括驱动系统、机械系统和传感器系统;大语言模块用于接收用户通过自然语言对话下达的交互任务,并向用户发送反馈确认信息;大语言模块还用于生成运动规划信息,并将该运动规划信息发送至运动控制模块;记忆模块负责存储和检索与交互任务相关联的知识信息,知识信息包括经验信息;感知模块用于接收大语言模块发送的感知信息请求;运动控制模块用于根据大语言模块生成的规划信息、结合记忆模块存储和检索的知识信息和感知模块提供的感知信息;本方案适合高精度和动态调整的场景,通用性强。

技术研发人员:夏晓丹,李文鹏,陈海波
受保护的技术使用者:青岛海发环保产业控股有限公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-22116.html

最新回复(0)