一种基于Koopman线性化模型的机械臂一体化规划控制方法

专利2025-05-20  35


本发明涉及了一种机械臂一体化规划控制方法,具体涉及一种基于koopman线性化模型的机械臂一体化规划控制方法。


背景技术:

1、在例如机械臂操作、智能车控制等各种工业应用中,实现具有快响应速度、高稳态精度的高性能控制都极为重要。然而,需要注意的是,传统控制器所跟踪的理想轨迹通常是离线生成的,而现实机械臂系统中不可避免存在的状态和输入约束。当实际机械臂系统因不匹配初始状态或者大干扰导致与期望轨迹发生大的跟踪误差时,对期望轨迹重新规划使其尊重状态和输入约束显得尤为重要。因此,例如模型预测控制这一类将规划和控制相结合的方法被广泛用于工业系统控制中。然而,模型预测控制中需要根据系统是动力学方程求解非线性优化方程,这使得对于动力学模型复杂的系统无法实时在线求得非线性优化方程的数值解,从而导致此类方法无法应用。因此,发展出一个能够适用于复杂非线性系统的在线优化求解算法,并保证系统具有高性能控制效果是一个亟待解决的问题。


技术实现思路

1、为了解决背景技术中存在的问题,本发明所提供一种基于koopman线性化模型的机械臂一体化规划控制方法。koopman算子是一个能有效把复杂非线性动力学模型线性化的方法,它通过将有限维非线性动力学模型升维到无限维的线性系统,然后找出能与此无限维的线性系统最为近似的有限维线性系统作为最终的近似结果。因此,可以将一体化规划控制方法和koopman算子进行有效结合。

2、本发明采用的技术方案是:

3、本发明的基于koopman线性化模型的机械臂一体化规划控制方法,包括:

4、步骤1,建立基于深度神经网络的koopman线性化模型及其损失函数,采集机械臂的连续时刻的实际状态作为训练集并输入基于深度神经网络的koopman线性化模型进行训练,直至损失函数收敛获得训练完成的基于深度神经网络的koopman线性化模型,基于训练完成的基于深度神经网络的koopman线性化模型构建优化模型。

5、步骤2,建立机械臂的一体化规划控制模型,一体化规划控制模型包括优化模型和自适应鲁棒控制器。

6、步骤3,将机械臂的实际状态和期望轨迹输入优化模型中进行处理,优化模型处理后输出机械臂的期望轨迹的再规划轨迹;将机械臂的实际状态和期望轨迹的再规划轨迹输入自适应鲁棒控制器中进行处理,自适应鲁棒控制器处理后输出机械臂的最终的控制输入,进而对外干扰下的机械臂进行控制,实现机械臂的一体化规划控制。

7、所述的步骤1中,基于深度神经网络的koopman线性化模型具体如下:

8、

9、其中,ψk、ψk+r和ψk+r+1分别为经深度神经网络编码后的koopman线性化模型在k时刻、k+r时刻和k+r+1时刻的状态向量;φ()为深度神经网络的编码函数,θ为深度神经网络的网络权重,xk为机械臂在k时刻的实际状态,机械臂在k时刻的实际状态xk包括机械臂在k时刻的关节角度和角速度;kx、ku和c分别为koopman线性化模型的状态矩阵、输入矩阵和解码矩阵,kx和ku为koopman线性化模型的koopman算子;uk+r为机械臂在k+r时刻的控制输入;为机械臂在k+r+1时刻的实际状态的预测值。

10、基于深度神经网络的koopman线性化模型的损失函数具体如下:

11、

12、其中,β1、β3和β3分别为损失函数的第一、第二和第三权重参数;为机械臂的实际状态的预测误差,为koopman线性化模型的预测误差;m为用于深度神经网络训练的训练集的数据量;为二范数;xk+j和分别为机械臂在k+j时刻的实际状态及其预测值;ψk+j为经深度神经网络编码后的koopman线性化模型在k+j时刻的状态向量。

13、深度神经网络由全连接神经网络构成,其输入为机械臂当前的实际状态,输出为koopman线性化模型的系统状态;全连接神经网络的隐藏层如下:

14、zi=σ(wizi-1+bi)

15、σ(γ)=max(0,γ)

16、其中,zi和zi-1分别为第i个和第i-1个隐藏层的输出;σ()为relu激活函数,γ为relu激活函数的输入,max()为最大值函数;wi为第i个隐藏层的权重参数;bi为第i个隐藏层的偏置。

17、所述的步骤1中,基于训练完成的基于深度神经网络的koopman线性化模型构建优化模型j具体如下:

18、

19、其中,为机械臂在k+r时刻的实际状态的预测值,为机械臂在0至t时刻的实际状态的预测值的集合,即机械臂的期望轨迹的再规划轨迹,t为预测时间长度;uk+r为机械臂在k+r时刻的控制输入,为机械臂在0至t-1时刻的控制输入的集合;xd为机械臂的期望轨迹;和分别为加权矩阵q和加权范数h;ωx和ωu为机械臂的状态约束和输入约束;xpq为机械臂的第q个关节的实际状态,x1q和x2q分别为机械臂的第q个关节的实际关节角度和实际关节角速度,为实数集,upq和lpq分别为机械臂的第q个关节的实际状态的上下限,u1q和l1q分别为机械臂的第q个关节的实际关节角度x1q的上下限,u2q和l2q分别为机械臂的第q个关节的实际关节角速度x2q的上下限;uq为机械臂的第q个关节的控制输入,uuq和luq分别为机械臂的第q个关节的控制输入的上下限。

20、优化模型j通过qp求解器进行求解。

21、所述的步骤2中,自适应鲁棒控制器包括参数和干扰估计律和鲁棒控制律,将机械臂的实际状态和期望轨迹的再规划轨迹输入参数和干扰估计律中进行处理,参数和干扰估计律处理后输出机械臂在下一时刻的不确定参数集以及外干扰与未建模不确定性构成的不确定性集合,并输入至鲁棒控制律中进行处理,鲁棒控制律处理后输出机械臂的控制输入。

22、所述的参数和干扰估计律具体如下:

23、

24、

25、其中,和分别为机械臂中的不确定参数集及其估计值,机械臂的不确定参数集中的不确定参数包括连杆质量和质心位置;为机械臂中的不确定参数集的估计值的导数,即参数更新律;为正的参数更新权重对角矩阵;ε为自适应函数;和projd()分别为第一和第二映射函数;为基于机械臂参数化模型的基底函数;e1和e2分别为优化模型和自适应鲁棒控制器的第一和第二跟踪误差,为优化模型和自适应鲁棒控制器的第一跟踪误差的导数,k1为优化模型和自适应鲁棒控制器的第二跟踪误差e2的控制增益;x和分别为机械臂的实际状态及期望轨迹的再规划轨迹;d和分别为机械臂中的外干扰与未建模不确定性构成的不确定性集合及其估计值,为机械臂中的外干扰与未建模不确定性构成的不确定性集合的估计值的导数,即不确定性集合更新率;γ为正的不确定性集合更新权重对角矩阵。

26、参数更新律的映射函数具体如下:

27、

28、其中,·i为参数更新律的映射函数第i项,为机械臂中的不确定参数集的估计值的第i项;和分别为机械臂中的不确定参数集第i项的上下边界。

29、不确定性集合更新律的映射函数具体如下:

30、

31、其中,·为确定性集合更新律的映射函数的输入;为机械臂中不确定性集合d的估计值,dmax和dmin分别为机械臂中不确定性集合d的上下边界。

32、根据机械臂中的不确定参数集的估计值的导数获得下一时刻的机械臂中的不确定参数集;根据为机械臂中的外干扰与未建模不确定性构成的不确定性集合的估计值的导数获得下一时刻的机械臂中的外干扰与未建模不确定性构成的不确定性集合。

33、所述的鲁棒控制律如下:

34、u=ur+us

35、

36、us=us1+us2

37、us1=-kse2

38、

39、e2us2≤0

40、

41、其中,u为机械臂的最终的控制输入;us和ur分别为鲁棒控制律的鲁棒控制项和模型补偿项;x1d和x2d分别为机械臂的一阶期望轨迹和二阶期望轨迹,为机械臂的二阶期望轨迹的导数,即机械臂的外干扰的估计值;为基于机械臂参数化模型的基底函数;为机械臂中的不确定参数集的估计值;为机械臂中的外干扰与未建模不确定性构成的不确定性集合的估计值;us1和us2分别为鲁棒控制律的鲁棒控制项的比例反馈项和非线性鲁棒反馈项;ks为比例反馈项的控制增益;e2为优化模型和自适应鲁棒控制器的第二跟踪误差;和分别为参数估计误差和不确定性集合估计误差;为可以任意小的正常数;和分别为机械臂中的不确定参数集及其估计值;d和分别为机械臂中的外干扰与未建模不确定性构成的不确定性集合及其估计值。

42、本发明的电子设备,包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行如上述所述的方法。

43、本发明的计算机可读存储介质,其上存储有程序数据,所述程序数据被处理器执行时实现如上述所述的方法。

44、本发明方法利用基于深度神经网络的koopman模型对复杂非线性机械臂系统动力学模型进行线性化,并通过离线训练的方式保证线性化结果的准确性。基于线性化结果,建立优化模型对期望轨迹在状态和输入约束下进行再规划,并设计自适应鲁棒控制器对再规划轨迹进行准确的跟踪并有效处理机械臂系统中的各种不确定性。本发明方法可保证具有复杂动力学模型的非线性系统在其自身的状态和输入约束下,达到快响应速度、高稳态精度的高性能控制。

45、本发明的有益效果是:

46、1、本发明提出的一体化规划控制方法可以保证被控机械臂在与期望轨迹出现大跟踪误差后,能够在同时满足状态和输入约束的前提下,实现对期望轨迹的快速和高精度收敛效果,具有快速的瞬态响应性能和高的稳态跟踪精度。

47、2、本发明提出的基于深度神经网络的koopman线性化模型对复杂实际非线性机械臂系统的动力学进行简化,从而实现实时的轨迹优化,有效提高了优化模型的求解效率。

48、3、本发明通过自适应鲁棒控制器的参数估计律与不确定性集合律设计,保证优化模型对自适应鲁棒控制器优化结果的准确跟踪。


技术特征:

1.一种基于koopman线性化模型的机械臂一体化规划控制方法,其特征在于,包括:

2.根据权利要求1所述的基于koopman线性化模型的机械臂一体化规划控制方法,其特征在于:所述的步骤1中,基于深度神经网络的koopman线性化模型具体如下:

3.根据权利要求2所述的基于koopman线性化模型的机械臂一体化规划控制方法,其特征在于:所述的步骤1中,基于训练完成的基于深度神经网络的koopman线性化模型构建优化模型j具体如下:

4.根据权利要求1所述的基于koopman线性化模型的机械臂一体化规划控制方法,其特征在于:所述的步骤2中,自适应鲁棒控制器包括参数和干扰估计律和鲁棒控制律,将机械臂的实际状态和期望轨迹的再规划轨迹输入参数和干扰估计律中进行处理,参数和干扰估计律处理后输出机械臂在下一时刻的不确定参数集以及外干扰与未建模不确定性构成的不确定性集合,并输入至鲁棒控制律中进行处理,鲁棒控制律处理后输出机械臂的控制输入。

5.根据权利要求4所述的基于koopman线性化模型的机械臂一体化规划控制方法,其特征在于:所述的参数和干扰估计律具体如下:

6.根据权利要求4所述的基于koopman线性化模型的机械臂一体化规划控制方法,其特征在于:所述的鲁棒控制律如下:

7.一种电子设备,其特征在于,包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行如权利要求1-6中任一项所述的方法。

8.一种计算机可读存储介质,其上存储有程序数据,其特征在于,所述程序数据被处理器执行时实现如权利要求1-6中任一项所述的方法。


技术总结
本发明公开了一种基于Koopman线性化模型的机械臂一体化规划控制方法。方法包括:建立基于深度神经网络的Koopman线性化模型及其损失函数并进行训练,从而构建优化模型;建立机械臂的包括优化模型和自适应鲁棒控制器的一体化规划控制模型;将机械臂的实际状态和期望轨迹输入优化模型中,处理后输出机械臂的期望轨迹的再规划轨迹再输入自适应鲁棒控制器中,处理后输出机械臂的最终的控制输入对机械臂进行一体化规划控制。本发明方法对复杂非线性机械臂模型进行线性化,保证机械臂在与期望轨迹出现大跟踪误差后,在满足约束下实现对期望轨迹的快速和高精度收敛,具有快速的瞬态响应性能和高的稳态跟踪精度,保证准确跟踪。

技术研发人员:陈正,傅瑾娜,黄方昊,聂勇,唐建中
受保护的技术使用者:浙江大学海南研究院
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-14129.html

最新回复(0)