本发明属于智能客车,尤其涉及一种智能客车跟踪预定轨迹的控制方法。
背景技术:
1、智能客车能够提高交通安全和运输效率,同时智能客车的发展推动了人工智能、传感器、通信技术等相关领域的技术创新。路径跟踪控制作为实现智能客车的关键性技术之一,如何提高智能客车的复杂路况适应性是当前的研究热点之一。
2、传统的智能客车跟踪预定轨迹的控制方法如纯追踪、stanley和pid等,虽然能够实现跟踪预定轨迹的功能,但是在速度较高和复杂路径情况下,跟踪精度较低。一些学者基于客车的数学模型提出了滑模控制和模型预测等优化控制方法,虽然提高了跟踪精度,但是对模型的精确性要求比较高,而且计算复杂性度高,尤其是复杂路况下需要重新调整控制参数。
3、为了提高智能客车对于复杂路况的适应性,一些学者结合传统控制理论与先进的人工智能技术提出了智能路径跟踪控制方法,例如神经网络和模糊控制等方法。基于神经网络的控制方法训练时间长而且需要大量的训练数据,最终训练出的网络模型受数据影响大,解释性较差。基于模糊逻辑的控制方法依赖专家经验设计模糊规则,难以自适应地进行调整。
技术实现思路
1、为解决上述背景技术中提出的至少一个问题本发明提供了一种智能客车跟踪预定轨迹的控制方法,以期在不需要反复调教控制参数的情况下,实现在不同的形状轨迹及速度下获得较高的控制精度,从而提高智能客车在复杂路况下的自主优化能力和适应性。
2、为实现上述目的,本发明提供如下技术方案:一种智能客车跟踪预定轨迹的控制方法,包括如下步骤:
3、s1:以智能客车安装的gps传感器主天线处为坐标原点,建立局部坐标系;以大地质心为原点,建立大地全局坐标系;
4、s2:驾驶智能客车行驶一段轨迹后,记录n行经度、纬度、航向角和速度信息作为跟踪的预定轨迹;
5、s3:对采集的智能客车状态样本基于近似线性相关分析方法得到核词典;
6、s4:确定当前时刻下智能客车的位姿信息和预瞄点处的位姿信息,并且计算从而建立局部坐标系下的轨迹跟踪误差状态方程,i为正整数;
7、s5:计算当前时刻下的道路曲率;
8、s6:建立智能客车路径跟踪控制问题的mdp模型;
9、s7:基于mkdhp算法设计跟踪预定轨迹的控制器,控制器包括执行器模块和评价器模块,其中执行器模块输出当前时刻下的控制动作,评价器模块包括第一评价器模块、第二评价器模块;分别输出当前时刻下和下一时刻下状态值函数对状态的导数和;
10、s8:建立mkdhp算法中执行器模块和评价器模块的在线更新规则;
11、s9:判断当前时刻下距离智能客车最近的预定轨迹中的目标点是否为终点,若是,智能客车停止行驶;否则,将i+1赋值给i,并返回s4顺序执行。
12、s3中核词典的构建方法如下,
13、步骤3.1、选择式(1)作为核函数:
14、 (1);
15、式(1)中,和为样本中的状态向量,为高斯核函数的核宽度,和为多项式核函数的参数;
16、步骤3.2、对智能客车状态样本集基于近似线性相关分析方法已获得个特征向量,为已获得的核词典,判断是否将新特征向量加入到核词典中,首先利用式(2)和式(3)计算:
17、;
18、式(2)中,为核词典中的元素,则为:
19、;
20、然后将计算的与预定义阈值进行比较来更新核词典,若,将添加到核词典中,即;否则核词典没有变化。
21、s4中局部坐标系下的轨迹跟踪误差状态方程构建方法如下,
22、步骤4.1、定义当前时刻下智能客车后轴中心在全局坐标系中的位置坐标为,速度为,航向角为,记为;
23、步骤4.2、设定为预瞄距离,在预定轨迹中搜索大于预瞄距离l且距离智能客车最近的目标点,则该目标点定义为预瞄点,记为;
24、步骤4.3、定义智能客车在当前时刻下相对于预瞄点的误差状态方程为:
25、;
26、式(4)中,分别为当前时刻下纵向偏差、横向偏差和航向角偏差;
27、步骤4.4、根据式(5)得到局部坐标系中智能客车与预瞄距离处的预瞄点的横向偏差与航向角偏差的变化率为:
28、;
29、式(5)中,和分别为在当前时刻下智能客车后轴中心点的纵向和侧向速度,为智能客车轴距,为当前时刻智能客车的前轮转角,为预瞄点处的道路曲率。
30、s5中道路曲率的计算方法如下,
31、步骤5.1、在当前时刻下从预定轨迹中选择距离智能客车最近的目标点,使用式(6)计算到预瞄点的距离,若,则使用二次多项式拟合至之间的轨迹;否则在预定轨迹中搜索大于距离且距离智能客车最近的目标点,使用二次多项式拟合至之间的轨迹;
32、;
33、式(6)中为所拟合轨迹的目标点个数;
34、步骤5.2、使用的二次多项式对上述轨迹进行拟和,拟合的二次多项式方程如式(7)所示:
35、;
36、式(7)中为常数项系数,为一次项系数,为二次项系数;
37、则道路曲率。
38、s6中mdp模型的建立方法如下,
39、步骤6.1、定义智能客车在当前时刻下的状态向量为,定义智能客车在当前时刻下的控制动作为智能客车期望行驶曲率的补偿量;
40、步骤6.2、利用式(8)计算当前时刻下状态向量的回报:
41、 ;
42、式(8)中,其中为与状态维数相关的半正定对角矩阵,为一正常数;
43、步骤6.3、定义当前时刻下状态值函数值,计算式如下:
44、 ;
45、式(9)中,为当前时刻下的智能客车状态向量,为当前时刻下控制动作,为当前时刻下的立即回报值,为折扣因子,为下一时刻下的目标函数值,为下一时刻下的智能客车状态向量,由式(10)计算:
46、;
47、式(10)中,为控制周期,;
48、步骤6.4、利用式(11)计算当前时刻下最优的控制动作:
49、 (11) 。
50、s7中跟踪预定轨迹的控制器设计方法如下,
51、利用式(12)计算mkdhp算法中执行器输出并作为智能客车当前时刻下的控制动作:
52、;
53、式(12)中,为最大侧向加速度,;分别为输入层到隐含层的第一权值和偏置,;分别为隐含层到输出层的第二权值和偏置,;
54、利用式(13)计算mkdhp算法中评价器输出并作为智能客车当前时刻下的目标:
55、;
56、式(13)中,为当前时刻下评价器权值矩阵,为核词典中样本构成的基函数,,为核词典中样本个数。
57、s8中执行器模块和评价器模块的在线更新规则如下,
58、步骤8.1、执行器模块的在线更新规则:
59、将极小化利用式(14)建立的误差函数作为执行器模块的学习目标:
60、;
61、利用式(15)-式(18)更新当前时刻下执行器模块的权值和偏置,从而获得下一时刻下的权值和偏置:
62、;
63、;
64、;
65、;
66、式(15)-式(18)中为评价器模块的学习步长,;
67、步骤8.2、评价器模块的在线更新规则:
68、利用式(19)定义误差函数为:
69、 ;
70、式(19)中表示为向量中第个元素,表示为向量中第个元素,可由式(20)得到:
71、;
72、对于状态,假设为其维数,则,利用式(21)定义中间变量:
73、;
74、式(21)中为对角矩阵中第个对角元素值,表示状态中第个元素,表示权值矩阵中第行权值向量,则利用式(22)得到误差函数的第行向量为:
75、 (22);
76、定义中间变量,利用式(23)-式(25)更新当前时刻下评价器模块的权值,从而获得下一时刻下的权值:
77、;
78、 (24);
79、;
80、式(23)-式(25)中,为评价器模块的学习步长,为遗忘因子,。
81、与现有技术相比,本发明的有益效果是:1、本发明首先建立了智能客车跟踪预定轨迹控制问题的mdp模型,选取了横向偏差、航向角偏差、道路曲率和当前车速v作为状态向量,综合误差性能指标、安全性和稳定性设计了回报函数,然后提出了一种基于mkdhp算法的跟踪预定轨迹的控制方法,其中执行器采用三层前馈神经网络构建,评价器采用了基于稀疏核方法获得的基函数进行构建,并推导了执行器和评价器的权值更新规则,解决了智能客车传统控制方法在复杂路况下需要反复调教控制参数缺乏适应性的问题,实现了在不同的形状轨迹及速度下获得较高的控制精度,提高了智能客车在复杂路况下的自主优化能力和适应性;
82、2、本发明采用了高斯核函数和多项式核函数结合的混合核函数构建基函数,解决了传统近似动态规划算法特征选择困难和学习效率低的问题,提高了基于mkdhp算法的路径跟踪控制器的泛化能力和实时优化能力;
83、3、本发明在跟踪预定轨迹过程中仅需要目标点相对智能客车的坐标,因此不局限gps一种传感器,可以使用其他定位手段如光学、雷达等传感器获取目标点相对智能客车的坐标,因此本发明方法具有较好通用性和普适性,适用于不同定位手段的智能客车;
84、4、本发明智能客车跟踪预定轨迹的控制方法,综合考虑了误差性能指标、安全性和稳定性,能够实现智能客车较高精度跟踪预定轨迹的同时,提高行驶的安全性和乘员的舒适性;
85、5、由于本发明采用三层前馈神经网络构建mkdhp算法中的执行器,且基于ald分析方法获得的基函数构建评价器,从而构建基于mkdhp算法的路径跟踪控制器框架,不仅可靠性和鲁棒性较高,而且实现简单。
1.一种智能客车跟踪预定轨迹的控制方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的一种智能客车跟踪预定轨迹的控制方法,其特征在于:所述s3中核词典的构建方法如下,
3.根据权利要求1所述的一种智能客车跟踪预定轨迹的控制方法,其特征在于:所述s4中局部坐标系下的轨迹跟踪误差状态方程构建方法如下,
4.根据权利要求1所述的一种智能客车跟踪预定轨迹的控制方法,其特征在于:所述s5中道路曲率的计算方法如下,
5.根据权利要求1所述的一种智能客车跟踪预定轨迹的控制方法,其特征在于:所述s6中mdp模型的建立方法如下
6.根据权利要求1所述的一种智能客车跟踪预定轨迹的控制方法,其特征在于:所述s7中跟踪预定轨迹的控制器设计方法如下
7.根据权利要求1所述的一种智能客车跟踪预定轨迹的控制方法,其特征在于:所述s8中执行器模块和评价器模块的在线更新规则如下,