一种基于模型预测控制的人形机器人避障的方法

专利2025-06-01  4


本发明涉及人形机器人控制,特别涉及一种基于模型预测控制的人形机器人避障的方法。


背景技术:

1、目前人形机器人采用的避障动作有:1.侧步避障:即机器人通过向一侧移动脚步来避开前方的障碍物;但在需要快速通过狭窄空间或避开紧急障碍物时,侧步避障不如向前倒立跨越障碍物的方式那样直接和高效,在极度狭窄的环境中侧步避障可能会受到空间限制,无法有效避开障碍物;2.转身避障:即机器人检测到前方有障碍物时,可以通过转身来改变行进方向,从而避开障碍物;但转身避障意味着机器人需要改变原来的行进方向,可能会增加到达目的地的路径长度和时间,且在某些复杂环境中,转身避障会受到机器人灵活性或周围障碍物的限制,而向前倒立跨越障碍物的方式不需要改变方向,节省时间,提高移动效率;3.跳跃避障:即对于一些较高的障碍物,机器人通过跳跃的方式来越过;但这种方式要求机器人具备强大的动力系统和精确的跳跃控制,且具有很大的不稳定性,跳跃过程中可能存在失控或摔倒的风险,对机器人和周围环境造成损伤。


技术实现思路

1、本发明公开了一种基于模型预测控制的人形机器人避障的方法,具体方法如下:

2、通过设置在人形机器人头部的激光扫描仪,扫描人形机器人前方道路,根据扫描结果形成坐标点云,绘制人形机器人前方道路地势图;

3、通过设置在人形机器人髕部的深度相机,计算障碍物的高度;

4、判断障碍物高度是否大于人形机器人腿长;

5、若是,则控制人形机器人行走至障碍物前,执行绕行障碍物操作;

6、若否,则控制人形机器人行走至障碍物前,执行倒立翻转跨越障碍物操作。

7、进一步地,形成坐标点云,具体公式如下:

8、x=lcosαcosβ

9、y=lcosαcosβ

10、z=lcosαcosβ

11、式中,l为发射出的激光反射回来后目标扫描点到激光扫描仪的距离,α和β分别为激光扫描仪的激光反射镜在水平和竖直方向的旋转角度,x、y和z分别为目标扫描点相对于激光扫描仪的x、y和z轴坐标值。

12、进一步地,计算障碍物的高度,计算公式如下:

13、

14、式中,z为障碍物底部的成像点与人形机器人髋部搭载的深度相机之间的距离,f为深度相机的焦距,t障碍物顶部的成像点与人形机器人髋部搭载的深度相机之间的距离,x0l为前方障碍物的扫描点在深度相机左侧摄像头上成像的横轴坐标,x0r为前方障碍物的扫描点在深度相机右侧摄像头上成像的横轴坐标。

15、进一步地,执行倒立翻转跨越障碍物操作,具体方法如下:

16、构建人形机器人动力学模型;

17、以基于模型预测控制算法的人形机器人控制器,完成人形机器人在倒立翻转跨动作中的姿态调节。

18、进一步地,构建人形机器人动力学模型,具体方法如下:

19、将人形机器人简化为带弹簧和阻尼器的单质量倒立摆,运动方程为:

20、

21、式中,m为机器人的质量,s为倒立摆的支撑点到质点的长度,即机器人在行走前处于准备姿势时从地面到质点的高度,c是阻尼常数,k是弹簧常数,g是重力加速度,τ是施加在机器人上的力矩,δ为倒立摆的角度,对应于机器人腿部与地面垂直方向的倾斜角,uδ是倒立摆的输出角,由机器人控制器输入;

22、u为控制器对于质心的位移,近似为:

23、

24、式中,m为机器人的质量,s为倒立摆的支撑点到质点的长度,即机器人在行走前处于准备姿势时从地面到质点的高度,c是阻尼常数,k是弹簧常数,g是重力加速度,τ是施加在机器人上的力矩,δ为倒立摆的角度,对应于机器人腿部与地面垂直方向的倾斜角,uδ是倒立摆的输出角,由机器人控制器输入;

25、机器人在x方向上的零力矩点zmp计算如下:

26、

27、式中,fy为y方向的地面反力,fz为z方向地面反力;

28、由于fy也是弹簧和减震器的反力矩,由弹簧和减震器的作用可以写成:

29、

30、式中s为倒立摆的支撑点到质点的长度,即机器人在行走前处于准备姿势时从地面到质点的高度,c是阻尼常数,k是弹簧常数,δ为倒立摆的角度,对应于机器人腿部与地面垂直方向的倾斜角;

31、当不受干扰时,可以推导出和两式的状态空间方程:

32、

33、式中m为机器人的质量,s为倒立摆的支撑点到质点的长度,即机器人在行走前处于准备姿势时从地面到质点的高度,c是阻尼常数,k是弹簧常数,g是重力加速度,δ为倒立摆的角度,对应于机器人腿部与地面垂直方向的倾斜角,u是控制器对于质心的位移;两式状态为机器人的角度δ和角速度

34、进一步地,所述人形机器人控制器,将深度相机测得的距离输入信号编码为一个神经元,在输入距离呈现之后,与输入距离最匹配的神经元被选为最优神经元;

35、之后对最优神经元实现权值更新,在奖励函数的指导下利用输入的模式信息和需要优化的性能指标,自主找到正确的控制动作。

36、进一步地,人形机器人控制器,具体设置方法如下:

37、定义网络结构和超参数,随机初始化输入和输出权重;

38、在时间i(t)时呈现输入模式,并使用深度相机测量距离,选择最优神经元ns,它将i(t)与连接ns到输入节点的输入权重向量之间的距离最小化;其中i(t)为输入模式;

39、对于最优神经元ns,对应的输出权值用于产生控制动作;即采用绕动版本在最优神经元权值中加入高斯零均值随机变量λ,乘上与最优神经元ns相关的增益αs;αs从一个初始值开始,固定一个终值,随着学习阶段的进行,αs在这两个值之间呈线性递减;其中o(t)为输出控制信号;

40、实际奖励函数r(t)与奖励增量δr=r(t)-r(t-1)一起进行评估;如果δr>bs,其中bs为与神经元ns相关的平均增量;bs的更新规则如下:

41、

42、其中σ>0,为新平均增量,为旧平均增量,δr为平均增量;

43、连接到最优神经元ns及其相邻神经元的输入和输出权重根据以下规则更新:

44、wi,in(t+1)=wi,in(t)+ηinζ(i(t)-wi,in(t))

45、wi,out(t+1)=wi,out(t)+ηoutζ(o(t)-wi,out(t))

46、其中ηin为输入学习率,ηout为输出学习率,wi,in输入权值,wi,out为输出权值,ζ为神经元的邻域函数,如果nr表示半径为r的邻域,则在当前最优神经元ns周围,有:

47、

48、ζ建立了环绕着ns的半径邻域,权值在这个范围内更新;

49、在每次学习迭代中,给出一个输出模式,选择一个最优神经元ns并提供输出信号,之后评估奖励并执行学习阶段,即更新wi,in,wi,out,bs和αs,在若干次迭代之后执行其他学习超参数的更新。

50、进一步地,在倒立翻转跨越障碍物操作后,人形控制器计算维持身体站立位置所需的力,之后将这些力用作控制器的输入信号,控制器提供稳定的关节扭矩;

51、如果此时机器人结构发生变化导致重心偏移,则添加一个自适应非线性控制器mmc作为前馈误差补偿器用来调整机器人的姿态,这个自适应非线性控制器mmc提供一个额外的非线性前馈控制动作,通过雅可比矩阵变换关节扭矩后,以力的形式添加到底层的腿部关节控制器中;引入一个奖励函数:

52、

53、式中θref为机器人的参考俯仰速度,θ为机器人的实际俯仰速度,为机器人的参考俯仰加速度,为机器人的实际俯仰加速度,β为引入的增益,建立俯仰速度对俯仰位置误差的优先级:随着俯仰误差的减小,俯仰速度误差的相关性越大;

54、对机器人进行控制的算法通过改进奖励函数实现输出权值的更新从而保证跨越动作完成的稳定性,奖励函数考虑了参考和机器人实际俯仰之间的误差。

55、由于采用了上述技术方案,本发明具有以下有益效果:

56、1、向前倒立跨越障碍物的方式能够直接跨越障碍物,无需像其他方式那样通过绕行或避让来达成目的,避免了传统避障方法会增加移动距离和时长的情况,在特定情景下可以显著提高移动效率。

57、2、前倒立跨越障碍物的方式通过调整倒立的高度和姿态可以适应低于腿部高度的不同种类的障碍物,具有一定的灵活性;在崎岖不平或狭窄空间内,传统避障方式难以有效应对时,该方式可以克服这些限制,实现稳定移动。

58、3、本发明引入的模型预测算法可以根据当前系统的状态和预测模型,预测未来一段时间内的运动轨迹,具有较强的鲁棒性和灵活性;且引入了一个自适应非线性控制器不需要先验地了解机器人的物理特性,控制器不需要内部迭代,在适当映射输入信号后,能快速达到奖励函数最大值,提供了永无止境的学习机会;

59、4、本发明通过将向前倒立跨越障碍物的方式与基于模型预测算法相结合,在能完成特定环境任务的同时,提高了工作效率和稳定性,应用前景广阔。

60、本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书实现和获得。


技术特征:

1.一种基于模型预测控制的人形机器人避障的方法,其特征在于,具体方法如下:

2.如权利要求1所述的基于模型预测控制的人形机器人避障的方法,其特征在于,形成坐标点云,具体公式如下:

3.如权利要求1所述的基于模型预测控制的人形机器人避障的方法,其特征在于,计算障碍物的高度,计算公式如下:

4.如权利要求1所述的基于模型预测控制的人形机器人避障的方法,其特征在于,执行倒立翻转跨越障碍物操作,具体方法如下:

5.如权利要求4所述的基于模型预测控制的人形机器人避障的方法,其特征在于,构建人形机器人动力学模型,具体方法如下:

6.如权利要求5所述的基于模型预测控制的人形机器人避障的方法,其特征在于,所述人形机器人控制器,将深度相机测得的距离输入信号编码为一个神经元,在输入距离呈现之后,与输入距离最匹配的神经元被选为最优神经元;

7.如权利要求6所述的基于模型预测控制的人形机器人避障的方法,其特征在于,人形机器人控制器,具体设置方法如下:

8.如权利要求7所述的基于模型预测控制的人形机器人避障的方法,其特征在于,在倒立翻转跨越障碍物操作后,人形控制器计算维持身体站立位置所需的力,之后将这些力用作控制器的输入信号,控制器提供稳定的关节扭矩;


技术总结
本发明涉及人形机器人控制技术领域,特别涉及一种基于模型预测控制的人形机器人避障的方法。通过设置在人形机器人头部的激光扫描仪,扫描人形机器人前方道路,根据扫描结果形成坐标点云,绘制人形机器人前方道路地势图;通过设置在人形机器人髕部的深度相机,计算障碍物的高度;当障碍物高度小于人形机器人腿长时,控制人形机器人行走至障碍物前,执行倒立翻转跨越障碍物操作。本发明通过将向前倒立跨越障碍物的方式与基于模型预测算法相结合,在能完成特定环境任务的同时,提高了工作效率和稳定性,应用前景广阔。

技术研发人员:邢傲伟,甄圣超,钟华勇,张健
受保护的技术使用者:合肥工业大学
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-14551.html

最新回复(0)