本发明涉及机器人控制,具体而言,涉及一种基于学习型模型预测控制的水下机器人运动控制方法。
背景技术:
1、目前,水下机器人需要在复杂的海洋环境中自主完成各类作业任务,如资源勘探,水下搜救等。因此,水下机器人的运动控制的其完成作业任务的关键技术。
2、在现有技术中,模型预测控制(model predictive control,mpc)是一种常用的水下机器人的运动控制算法,其控制性能依赖于精准的控制模型。然而,洋流扰动和水动力参数所导致的控制模型与真实模型的不匹配会退化控制性能。综上,基于mpc的自主水下机器人的运动控制方法存在明显的不足:未能有效解决洋流扰动和参数摄动所带来的模型不匹配问题。
3、综上所述,存在如下至少一种技术问题:
4、未能有效解决洋流扰动和参数摄动所带来的模型不匹配问题;水下机器人运动控制性能有待提高。
技术实现思路
1、本发明的主要目的在于提供一种基于学习型模型预测控制(learning-basedmodel predictive control,lbmpc)的水下机器人运动控制方法,以解决现有技术中未能有效解决洋流扰动和参数摄动所带来的模型不匹配问题以及水下机器人运动控制性性能有待提高的问题。
2、为了实现上述目的,根据本发明的一个方面,提供了一种基于学习型模型预测控制的水下机器人运动控制方法,包括:
3、通过非参数学习方法进行学习,学习水下机器人由外部洋流扰动和参数摄动导致的不确定性较高的非线性动力学函数;
4、进行控制优化,基于lbmpc控制器构建优化控制问题;
5、计算收敛路径偏差的控制律,将学习到的不确定较高的非线性动力学函数用于滚动优化状态的转移中,通过求解优化控制问题得到水下机器人的控制律。
6、优选的,将外部洋流扰动和参数摄动导致的模型不匹配表示为一个未知时变的非线性项,由基于kinky inference(ki)预测方程的非参数学习方法进行实时估计,构建lbmpc控制器计算运动控制律,其中将非参数学习方法估计的非线性项用于滚动优化中的状态转移,以提高模型的匹配性。
7、优选的,包括:
8、步骤1:构建水下机器人状态量和控制量,并构建控制方程;
9、步骤2:构建非参数学习方法训练集,并确立估计的lipschitz常数;
10、步骤3:更新非参数学习方法训练集,获取当前时刻的状态量,构建并求解优化控制问题计算得到当前时刻水下机器人的控制量,下发给水下机器人执行。
11、优选的,所述步骤1包括:构建水下机器人状态量χ和控制量u,并构建控制方程
12、其中:是状态量;nx为状态量维数;是控制输入;nu为控制量维数;状态矩阵a和控制矩阵b是时变的;非线性函数表示含有有界未知扰动的未建模非线性动力学函数,其中是输出空间,是有界的未知过程噪声,并满足其中正常数是上界,是过程噪声空间,集合和假设是紧集。
13、优选的,所述步骤2包括:构建非参数学习方法训练集并确立估计的lipschitz常数ln;
14、其中是测量到的输入值,是输入空间,nn是训练集中采样点的个数,定义采样的输入集合为非线性动力学函数f的测量输出值定义为离线训练估计的lipschitz常数ln并确立训练集中采样点的个数nn。
15、优选的,通过重复步骤1-3进行水下机器人的运动控制作业。
16、本发明还提供了一种计算机系统,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序,以及实现通过非参数学习方法进行学习,学习水下机器人由外部洋流扰动和参数摄动导致的不确定性较高的非线性动力学函数;进行控制优化,基于lbmpc控制器构建优化控制问题;将学习到的不确定较高的非线性动力学函数用于滚动优化状态的转移中,通过求解优化控制问题得到水下机器人的控制律。
17、本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现通过非参数学习方法进行学习,学习水下机器人由外部洋流扰动和参数摄动导致的不确定性较高的非线性动力学函数;进行控制优化,基于lbmpc控制器构建优化控制问题;将学习到的不确定较高的非线性动力学函数用于滚动优化状态的转移中,通过求解优化控制问题得到水下机器人的控制律。
18、本发明还提供了一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现通过非参数学习方法进行学习,学习水下机器人由外部洋流扰动和参数摄动导致的不确定性较高的非线性动力学函数;进行控制优化,基于lbmpc控制器构建优化控制问题;将学习到的不确定较高的非线性动力学函数用于滚动优化状态的转移中,通过求解优化控制问题得到水下机器人的控制律。
19、应用本发明的技术方案,具有如下技术效果:
20、本发明提供了一种新型的非参数学习方法,基于ki预测方程实现了不确定性较高的非线性动力学函数的精准估计。其中采用动态更新的少采样点训练集,可保证非参数学习的实时性。
21、本发明提供了一种基于学习型模型预测控制的水下机器人运动控制器的设计方法,非参数学习方法的估计结果用于优化控制问题中的状态转移,可有效解决控制模型的不匹配性,起到提高水下机器人的运动控制性能的作用。
1.一种基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,包括:
2.如权利要求1所述的基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,将外部洋流扰动和参数摄动导致的模型不匹配一个未知时变的非线性项,由基于ki预测方程的非参数学习方法进行实时估计,构建lbmpc控制器计算运动控制律,其中将非参数学习方法估计的非线性项用于滚动优化中的状态转移,以提高模型的匹配性。
3.如权利要求1所述的基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,包括:
4.如权利要求1所述的基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,所述步骤1包括:构建水下机器人状态量x和控制量u,并构建控制方程
5.如权利要求4所述的基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,所述步骤2包括:构建非参数学习方法训练集并确立估计的lipschitz常数ln;
6.如权利要求3所述的基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,通过重复步骤1-3进行水下机器人的运动控制作业。
7.如权利要求1所述的基于学习型模型预测控制的水下机器人运动控制方法,其特征在于,所述。
8.一种计算机系统,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序,以及实现权利要求1所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1所述方法的步骤。