本发明属于机器人领域,具体涉及一种预定性能下抗扰动的无人机强化学习追踪控制方法,旨在实现无人机在预定性能下的抗扰动高效追踪控制。
背景技术:
1、无人机在军事、民用、商业等领域的应用越来越广泛,无人机的追踪控制是无人机应用的重要技术之一。无人机追踪控制是指无人机在执行任务时,根据任务要求,实现无人机实际轨迹对期望轨迹的有效追踪。无人机追踪控制的性能直接影响无人机的任务执行效果,因此,提高无人机的追踪控制性能是无人机应用的重要研究方向。
2、现有的无人机追踪控制方法主要包括模型预测控制、自适应控制、鲁棒控制等方法。这些方法在一定程度上提高了无人机的追踪控制性能,但是在实际应用中,无人机追踪控制仍然存在一些问题,包括无人机追踪控制性能不稳定、抗扰动性能差、无人机控制输入计算量大等问题。
技术实现思路
1、为了解决现有无人机追踪控制方法存在的问题,提高无人机的追踪控制性能和抗扰动性能,本发明提供了一种预定性能下抗扰动的无人机强化学习追踪控制方法。基于强化学习的方法,通过建立预定性能下的无人机转换追踪控制动力学系统,设计无人机最优控制器,考虑无人机最坏扰动,实现了在预定性能下的无人机追踪控制,并提升了无人机追踪控制的抗扰动性能。
2、为了达到上述目的,本发明采用如下技术方案:
3、一种预定性能下抗扰动的无人机强化学习追踪控制方法,包括如下步骤:
4、步骤一:设置无人机速度控制动力学系统和期望轨迹xd,根据期望轨迹和无人机速度控制动力学系统建立无人机追踪控制动力学系统:
5、
6、其中x为无人机速度控制动力学系统的状态变量,xd为期望轨迹的状态变量,f(x)为无人机速度控制动力学系统的偏移动态,g(x)为无人机速度控制动力学系统的输入矩阵,k(x)为无人机速度控制动力学系统的扰动矩阵,fd为期望轨迹的偏移动态,e=x-xd为无人机的追踪误差,为追踪误差e的导数,u为无人机控制输入,ω为无人机扰动输入;
7、步骤二:根据步骤一建立的无人机追踪控制动力学系统,为实现无人机追踪控制过程中满足预定的误差范围,将无人机的追踪误差e映射到无人机转化追踪误差上,得到预定性能下的无人机转化追踪误差,在得到的预定性能下的无人机转化追踪误差上进行后续的追踪控制器设计即能满足预定的误差范围要求,即预定性能;预定性能下的无人机转换追踪误差如下所示:
8、∈i=φ(ei,εl,i,εu,i)
9、εl,i≤ei≤εu,i
10、其中ei为追踪误差的第i个分量,εl,i和εu,i分别为追踪误差的第i个分量的下界和上界,∈i为无人机转换追踪误差的第i个分量,φ(ei,εl,i,εu,i)为追踪误差的第i个分量的转换函数;
11、步骤三:根据步骤二建立的预定性能下的无人机转换追踪误差,建立预定性能下的无人机转换追踪误差的动态:
12、
13、其中φi表示无人机转化追踪误差的第i个分量关于上下界链式导数之和,为追踪误差e的第i个分量的导数,和分别为追踪误差的第i个分量的下界和上界的导数;
14、步骤四:根据步骤三建立的预定性能下的无人机转换追踪误差的动态,建立预定性能下的无人机转换追踪控制动力学系统:
15、
16、其中f=h(f(x)-fd),g=h×g(x),k=h×k(x);
17、步骤五:根据步骤四建立的预定性能下的无人机转换追踪控制动力学系统,设置无人机二次型性能指标:
18、
19、其中q为系统状态惩罚矩阵,γ为扰动衰减系数,为无人机控制输入惩罚函数,usat为无人机控制输入饱和值,r为无人机控制输入惩罚矩阵;
20、步骤六:根据步骤五设置的无人机二次型性能指标,建立预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入和无人机最坏扰动:
21、
22、其中为无人机二次型性能指标j的梯度,u*为无人机最优控制输入,ω*为无人机最坏扰动;
23、步骤七:根据步骤五建立的无人机二次型性能指标与步骤六建立的预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入和无人机最坏扰动,建立并训练神经网络,用于逼近无人机二次型性能指标j:
24、
25、其中为神经网络的权重,ψ(∈)为神经网络的基元,为无人机二次型性能指标的神经网络逼近;
26、步骤八:根据步骤七建立的神经网络,建立预定性能下的无人机转换追踪控制动力学系统的无人机最优控制输入的神经网络逼近和最坏扰动的神经网络逼近:
27、
28、其中为无人机最优控制输入的神经网络逼近,为无人机最坏扰动的神经网络逼近;
29、通过计算步骤八设计的的无人机最优控制输入的神经网络逼近和最坏扰动的神经网络逼近,无人机实现预定性能下抗扰动的追踪控制,提高了无人机的追踪控制性能和抗扰动性能。
30、和现有技术相比较,本发明具备如下优点:
31、1.本发明通过建立预定性能下的无人机转换追踪控制动力学系统,设计无人机最优控制器,考虑无人机最坏扰动,实现了在预定性能下的无人机追踪控制,并提升了无人机追踪控制的抗扰动性能。
32、2.本发明通过强化学习设计和训练的无人机最优控制输入的神经网络逼近,对期望轨迹进行实时跟踪,降低了无人机计算最优控制输入的计算量,有效提高了无人机实现期望轨迹追踪控制任务的效率。
1.一种预定性能下抗扰动的无人机强化学习追踪控制方法,其特征在于:包括如下步骤: