车辆状态规划方法及装置、服务器、计算机可读存储介质与流程

专利2023-11-02 110

1.本发明涉及无人驾驶技术领域，更具体地，其涉及一种车辆状态规划方法及装置、服务器、计算机可读存储介质。

背景技术：

2.随着人工智能技术的不断成熟，无人驾驶也越来越受到人们的重视。无人驾驶技术能够代替人工进行车辆轨迹的规划，使车辆在道路上能够自行前进。但道路上情况复杂，需要在考虑其他车辆或行人安全的前提下完成轨迹规划。
3.现有技术在对车辆的轨迹进行规划时，是根据车辆上传感器获取到的信息对其他目标的行为进行预测，再根据预测结果规划车辆的轨迹，以获得一条与其他目标不发生碰撞的轨迹。
4.但是，现有技术在对轨迹进行规划时，对其他目标行为的预测与车辆轨迹的规划是分开进行的，并未考虑到车辆在行驶过程中与其他目标的相互影响，导致规划的轨迹与实际情况有较大差异。

技术实现要素：

5.本发明解决的技术问题是如何准确地对车辆的状态进行规划，以确定车辆在将来各个时刻的速度与方向。
6.为解决上述技术问题，本发明实施例提供一种车辆状态规划方法，所述车辆状态规划方法包括：获取第一目标车辆的第一状态信息与第一周围环境信息，所述第一周围环境信息包括多个第二目标的第二状态信息；根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组，每一基础状态组包括多个按时间排序的基础状态，所述基础状态表示所述第一目标车辆的加速度方向与转角方向；分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，所述次级状态组包括多个按时间排序的次级状态，所述次级状态用于使所述第一目标车辆与所述第二目标具有安全距离，所述次级状态表示所述第一目标车辆的加速度与转角；从多个次级状态组中选取最优次级状态组。
7.可选地，所述第一行驶状态表示所述第一目标车辆在各个预测时刻的第一位置和/或第一转角方向，所述第二行驶状态表示所述第二目标在各个预测时刻的第二位置和/或第二转角方向，所述根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组包括：根据在同一预测时刻的第一位置与第二位置的距离生成所述次级状态组；或者，根据在同一预测时刻的第一转角方向与第二转角方向的冲突关系生成所述次级状态组。
8.可选地，所述从多个次级状态组选取最优次级状态组包括：对所述次级状态组进行评价，按照评价得分选取最优次级状态组。
9.可选地，采用以下公式计算所述次级状态组的评价得分ftotal：f
total
＝λ1fe+λ2fs+
λ3fn，fe表示效率性参数，fs表示安全性参数，fs表示导航效用参数，λ1表示对应效率性参数的第一权重，λ2表示对应安全性参数的第二权重，λ3表示对应导航效用参数的第三权重；所述效率性参数采用以下公式计算：δv
p
＝|v
ego-v
pref
|，δvo＝|v
ego-v
lead
|，其中v
ego
为所述第一目标车辆的速度，v
pref
为所述第一目标车辆的偏好速度，v
lead
为所述第一目标车辆所处车道正前方的所述第二目标的速度，λ
ep
表示第四权重，λ
eo
表示第五权重，n表示每一次级状态组中次级状态的数量，所述第一目标车辆的速度是基于所述次级状态组中的加速度计算得到的；所述安全性参数采用以下公式计算：是基于所述次级状态组中的加速度计算得到的；所述安全性参数采用以下公式计算：其中bc为第一布尔值，用于表示模拟结束时所述第一目标车辆和各个第二目标是否已经发生碰撞，bd为第二布尔值，用于表示所述第一目标车辆和各个第二目标在未来预设时间段内是否发生碰撞，[v
min
,v
max
]表示安全速度范围，λ
sc
表示对应第一布尔值的第六权重，λ
sr1
表示第七权重，λ
sr2
表示第八权重，所述第一布尔值和所述第二布尔值是基于所述次级状态组中的转角计算得到的；所述导航效用参数采用以下公式计算：fn＝λ
userbuser
+λ
lastbuser
，其中b
user
为第三布尔值，表示所述基础状态组是否与人为设置的偏好基础状态组相同，b
last
为第四布尔值，表示所述基础状态组是否与上一周期的所述基础状态组相同，λ
user
表示对应第三布尔值的第九权重，λ
last
表示第四布尔值的第十权重。
[0010]
可选地，所述从多个次级状态组选取最优次级状态组之后包括：对所述最优次级状态组中至少一个次级状态的加速度和转角进行调整，以使加速度的方向变化频率以及转角的方向变化频率在预设范围内。
[0011]
可选地，在获取所述第一周围环境信息之后包括：当所述第一周围环境信息中第二目标与第一目标车辆的距离小于预设门限时，控制第一目标车辆的状态，以使所述第一目标车辆与所述第二目标的距离大于第一安全距离；重新获取第一状态信息与第一周围环境信息，直至第二目标与第一目标车辆的距离大于第二安全距离。
[0012]
可选地，所述根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组包括：基于所述第一状态信息构建所述第一目标车辆的动作搜索树，以及基于所述第一周围环境信息构建所述第二目标车辆的空间搜索树，所述动作搜索树的各个节点为所述第一目标车辆的基础状态，所述空间搜索树的各个节点为所述第二目标的第二状态信息，所述动作搜索树与所述空间搜索树中各个节点按照时间排列；根据所述空间搜索树的各个第二状态信息对同一时刻的所述动作搜索树的节点进行修剪，以删除导致所述第一目标车辆与所述第二目标发生碰撞的基础状态；遍历所述动作搜索树，以得到多个按时间排序的基础状态。
[0013]
可选地，所述根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态包括：使用自动驾驶模型模拟所述第二目标的第二行驶状态。
[0014]
本发明实施例还公开一种车辆状态规划装置，所述车辆状态规划装置包括：获取模块，用于获取第一目标车辆的第一状态信息与第一周围环境信息，所述第一周围环境信息包括多个第二目标的第二状态信息；基础状态组预测模块，用于根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组，每一基础状态组包括
多个按时间排序的基础状态，所述基础状态表示所述第一目标车辆的加速度方向与转角方向；模拟模块，用于分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；次级状态组生成模块，用于根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，所述次级状态组包括多个按时间排序的次级状态，所述次级状态用于使所述第一目标车辆与所述第二目标具有安全距离，所述次级状态表示所述第一目标车辆的加速度与转角；选取模块，用于从多个次级状态组中选取最优次级状态组。
[0015]
本发明实施例还公开一种服务器，包括存储器和处理器，所述存储器上存储有可在处理器上运行的计算机程序，所述计算机程序被处理器运行时执行上述任一种所述车辆状态规划方法的步骤。
[0016]
本发明实施例还公开一种计算机可读存储介质，其上存储有计算机程序，所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质，所述计算机程序被处理器运行时执行上述任一种所述车辆状态规划方法的步骤。
[0017]
与现有技术相比，本发明实施例的技术方案具有以下有益效果：
[0018]
本发明提出一种车辆状态规划方法，通过获取第一目标车辆的第一状态信息与第一周围环境信息，并根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组。在获取第二目标的第二状态信息时，不需要获取第二目标各维度的数据，仅需获取第二目标的速度与位置，可以降低对传感器的硬件要求。按照基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态，可以在模拟过程中考虑第一目标车辆对第二目标行为的影响。再根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，可以在模拟过程中根据其他车的行为确认第一目标车辆的加速度与转角，以考虑第二目标的行为对第一目标车辆造成的影响。并从多个次级状态组选取最优的次级状态组，使选取的次级状态组最符合实际情况，保证第一目标车辆的安全行驶。
[0019]
进一步地，对选取次级状态组后，对次级状态组进行优化，使加速度的方向变化频率以及转角的方向变化频率在预设范围内，避免频繁的加减速或者改变方向，令第一目标车辆在实际行驶过程中更符合人类的驾驶习惯。
[0020]
进一步地，在第一目标车辆的行驶过程中发生意外情况时，即第二目标与第一目标车辆的距离小于预设门限时，控制第一目标车辆与第二目标的距离大于第一安全距离，以避免与第二目标发生碰撞，保证自车与其他目标的安全。并在与第二目标的距离大于第二安全距离重新进行车辆状态规划。
附图说明
[0021]
图1是本发明实施例提供的一种车辆状态规划方法的整体流程图；
[0022]
图2是本发明实施例提供的一种车辆状态规划方法的示意图；
[0023]
图3是本发明实施例提供的一种车辆距离过近时进行车辆状态规划的示意图；
[0024]
图4是本发明实施例提供的一种车辆状态规划装置的结构示意图。
具体实施方式
[0025]
如背景技术中所述，随着人工智能技术的不断成熟，无人驾驶技术能够代替人工进行车辆轨迹的规划，使车辆在道路上能够自行前进。但道路上情况复杂，需要在考虑其他车辆或行人安全的前提下完成轨迹规划。现有技术在对车辆的轨迹进行规划时，是根据车辆上传感器获取到的信息对其他目标的行为进行预测，再根据预测结果规划车辆的轨迹，以获得一条与其他目标不发生碰撞的轨迹，但现有技术对其他目标行为的预测与车辆轨迹的规划是分开进行的，并未考虑到车辆在行驶过程中与其他目标的相互影响，导致规划的轨迹与实际情况有较大差异。
[0026]
本发明实施例中，通过获取第一目标车辆的第一状态信息与第一周围环境信息，并根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组。在获取第二目标的第二状态信息时，不需要获取第二目标各维度的数据，仅需获取第二目标的速度与位置，可以降低对传感器的硬件要求。按照基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态，可以在模拟过程中考虑第一目标车辆对第二目标行为的影响。再根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，可以在模拟过程中根据其他车的行为确认第一目标车辆的加速度与转角，以考虑第二目标的行为对第一目标车辆造成的影响。并从多个次级状态组选取最优次级状态组，使选取的次级状态组最符合实际情况，保证第一目标车辆的安全行驶。
[0027]
进一步地，对选取次级状态组后，对次级状态组进行优化，使加速度的方向变化频率以及转角的方向变化频率在预设范围内，避免频繁的加减速或者改变方向，令第一目标车辆在实际行驶过程中更符合人类的驾驶习惯。
[0028]
进一步地，在第一目标车辆的行驶过程中发生意外情况时，即第二目标与第一目标车辆的距离小于预设门限时，控制第一目标车辆与第二目标的距离大于第一安全距离，以避免与第二目标发生碰撞，保证自车与其他目标的安全。并在与第二目标的距离大于第二安全距离重新进行车辆状态规划。
[0029]
为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0030]
图1是本发明实施例提供的一种车辆状态规划方法的整体流程图。
[0031]
在具体实施中，下述步骤101至步骤105所记载的车辆状态规划方法可以用于服务器中。上述步骤具体可以由服务器来执行，也可以由服务器中具有数据处理功能的芯片所执行，也可以由服务器中包含有数据处理功能的芯片的芯片模组来执行。在一个具体的实施例中，可以由服务器执行车辆状态规划方法的各个步骤。
[0032]
具体地，如图1所示，车辆状态规划方法可以包括以下步骤：
[0033]
在步骤101中，获取第一目标车辆的第一状态信息与第一周围环境信息，所述第一周围环境信息包括多个第二目标的第二状态信息；
[0034]
在步骤102中，根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组，每一基础状态组包括多个按时间排序的基础状态，所述基础状
态表示所述第一目标车辆的加速度方向与转角方向；
[0035]
在步骤103中，分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；
[0036]
在步骤104中，根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，所述次级状态组包括多个多个按时间排序的次级状态，所述次级状态用于使所述第一目标车辆与所述第二目标具有安全距离，所述次级状态表示所述第一目标车辆的加速度与转角；
[0037]
在步骤105中，从所述多个次级状态组中选取最优次级状态组。
[0038]
至此，最优次级状态组已选取完毕，可根据最优次级状态组对第一目标车辆进行无人驾驶。
[0039]
在步骤101的具体实施中，获取第一目标车辆的第一状态信息，第一状态信息包括第一目标车辆的位置、速度、加速度、车辆朝向以及转角方向，并获取第一周围环境信息，第一周围环境信息包括多个第二目标的第二状态信息，第二状态信息包括第二目标的位置与速度。
[0040]
需要说明的是，第二目标可以是车辆、行人等任意可实施的能够移动的物体，本技术对此不做限制。
[0041]
在具体实施中，第一周围环境信息还可以包括道路上的车道线信息。可以使用车道线划分模型对道路进行车道线划分，以适应于车道线不易辨认的道路。车道线划分模型可以是提前训练完成的神经网络模型。具体地，第一周围环境信息可以是由第一目标车辆上的传感器采集得到并发送至服务器的。
[0042]
在步骤102的具体实施中，基于第一状态信息构建第一目标车辆的动作搜索树，以及基于第一周围环境信息构建第二目标车辆的空间搜索树。
[0043]
在具体实施中，动作搜索树的各个节点为第一目标车辆的基础状态，基础状态表示第一目标车辆的加速度方向与转角方向。具体地，基础状态可以表示第一目标车辆在某时刻进行加速或减速，以及表示第一目标车辆在某时刻进行左转或右转。转角方向可以对应于直角坐标系，当第一目标车辆向右偏转时，转角方向为正；当第一目标车辆向左偏转时，转角方向为负。例如，第一目标车辆的基础状态可以是在0秒～1秒的加速度方向为负，转角方向为正，则对应于第一目标车辆于0秒～1秒在减速且右转。
[0044]
在具体实施中，动作搜索树与空间搜索树中各个节点按照时间排列，空间搜索树的各个节点为多个第二目标的第二状态信息。具体地，按时间顺序对各个时刻的第二目标的第二状态信息进行拓展，以得到第二目标所有可能出现的第二状态信息。根据空间搜索树的各个第二状态信息对同一时刻的动作搜索树进行修剪，删除动作搜索树中会导致第一目标车辆与第二目标发生碰撞的基础状态。例如，在第2秒的第二状态信息表示有一个第二目标的位置位于第一目标车辆的右侧，此时第一目标车辆的基础状态若为右转，将与第二目标发生碰撞，因此删除转角方向向右的基础状态。
[0045]
进一步地，遍历修剪后的动作搜索树，得到多个按时间排序的基础状态，以组成多个基础状态组。例如，基础状态组中具体可以包括：0秒～1秒的加速度方向为负，转角方向为正；1秒～2秒的加速度为正，转角方向为负。对应于第一目标车辆在0秒～1秒减速且右
转，在1秒～2秒加速且左转。
[0046]
在步骤103的具体实施中，对第一目标车辆与第二目标的驾驶情况进行前向仿真，根据基础状态组模拟第一目标车辆在道路上的第一行驶状态，并根据第二目标的第二状态信息与第一行驶状态模拟多个第二目标的第二行驶状态。具体地，前向仿真可以分成多步进行，每步前向仿真对短时间内的行驶状态进行仿真。例如，第一步可以先对0～0.5秒的第一行驶状态与第二行驶状态进行仿真，第二步再基于第一步的结果对0.5秒～1秒的第一行驶状态与第二行驶状态进行仿真。
[0047]
在具体实施中，根据多个基础状态组分别对第一目标车辆的第一行驶状态进行模拟，以对第一目标车辆在各个时刻的状态进行仿真。该阶段并未确定加速度以及转角的具体数值，仅对第一目标车辆的加速度方向与转角方向进行仿真。具体地，可以基于部分可观察马尔科夫决策过程(partially observable markov decision process,pomdp)进行第一行驶状态与第二行驶状态的模拟，目标在行动前通过收集周围环境信息再采取动作，使各个目标进入下一状态，以完成真实情况的仿真。
[0048]
在具体实施中，可以使用自动驾驶模型对第二目标的第二行驶状态进行模拟，以得到第二目标的第二行驶状态。自动驾驶模型可以是预先训练完成的神经网络模型，自动驾驶模型可以模拟第二目标在道路上的第二行驶状态，以使第二目标的行为更接近真实环境。具体地，还可以通过调整训练集的内容对模拟过程中第二目标的行为进行调整。例如，通过调整训练集的内容，使模拟过程中第二目标的行为更具有进攻性，即在第一目标车辆需要变道时，后方的第二目标可以不减速避让；或者，通过调整训练集的内容，使模拟过程中第二目标的行为更具有规范性，第二目标车辆不会进行加塞等可能造成危险的行为。
[0049]
需要说明的是，自动驾驶模型可以是神经网络模型，或者其他任一可模拟第二行驶状态的数学模型，自动驾驶模型可根据实际应用场景进行选择，本技术对此不作限制。
[0050]
在步骤104的具体实施中，根据第一行驶状态与第二行驶状态的交互生成次级状态组，次级状态组包括多个按时间排序的次级状态，次级状态表示第一目标车辆的加速度与转角。例如，次级状态组可以包括：0秒～1秒的加速度为+5m/s，转角方向为45
°
；1秒～2秒的加速度为-10m/s，转角方向为0
°
。
[0051]
在具体实施中，根据第一行驶状态与第二行驶状态的交互确定各个基础状态组中加速度与转角的具体数值，以生成次级状态。第一行驶状态表示第一目标车辆在各个预测时刻的第一位置和/或第一转角方向，第二行驶状态表示第二目标在各个预测时刻的第二位置和/或第二转角方向。具体地，可以根据同一预测时刻的第一位置与第二位置的距离生成次级状态组，以保证第一位置与第二位置的距离大于安全距离。或者，根据在同一预测时刻的第一转角方向与第二转角方向的冲突关系生成次级状态组，以避免第一目标车辆与第二目标在转弯时发生碰撞。
[0052]
在具体实施中，次级状态可以保证第一目标车辆与第二目标具有安全距离，即第一目标车辆在次级状态时，不会与第二目标发生碰撞。例如，第一目标车辆在0秒～1秒的基础状态为转角为正，即第一目标车辆在0秒～1秒向右转以变换车道，而模拟情况中第一目标车辆右方的第二目标在第一目标车辆右转时并未减速避让，若第一目标车辆仍变换车道，将与第二目标发生碰撞。此时生成的次级状态可以是在0秒～1秒的转角角度为0
°
，即第一目标车辆将在0秒～1秒保持当前车道直行，以避免与右方的第二目标发生碰撞。
[0053]
在步骤105的具体实施中，对各个次级状态组进行评价，并按照评价得分选取最优次级状态组，可以选择评价得分最高的次级状态组作为最优次级状态组。
[0054]
在具体实施中，评价得分f
total
可以根据以下公式进行计算：
[0055]ftotal
＝λ1fe+λ2fs+λ3fnꢀꢀꢀꢀꢀꢀꢀ
(1)
[0056]
其中，fe表示效率性参数，fs表示安全性参数，fs表示导航效用参数，λ1表示对应效率性参数的第一权重，λ2表示对应安全性参数的第二权重，λ3表示对应导航效用参数的第三权重。
[0057]
效率性参数fe可以根据以下公式进行计算：
[0058][0059]
δv
p
＝|v
ego-v
pref
|
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0060]
δvo＝|v
ego-v
lead
|
ꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0061]
其中，v
ego
为第一目标车辆的速度，v
pref
为第一目标车辆的偏好速度，v
lead
为第一目标车辆所处车道正前方的第二目标的速度，λ
ep
表示第四权重，λ
eo
表示第五权重，n表示每一次级状态组中次级状态的数量，第一目标车辆的速度是基于次级状态组中的加速度计算得到的。具体地，可获取自动驾驶模型在进行前向仿真时第二目标的速度v
lead
，第一目标车辆的偏好速度v
pref
可以由用户预先设置。
[0062]
安全性参数fs可以根据以下公式进行计算：
[0063][0064][0065]
其中，bc为第一布尔值，用于表示模拟结束时第一目标车辆和各个第二目标是否已经发生碰撞，bd为第二布尔值，用于第一目标车辆和各个第二目标在未来预设时间段内是否发生碰撞，可以使用责任敏感安全模型(responsibility sensitive safety，rss)来判断第一目标车辆与第二目标是否发生碰撞，[v
min
,v
max
]为rss计算得到的安全速度范围。λ
sc
表示对应第一布尔值的第六权重，可以作为发生碰撞后的一个惩罚项以对安全性参数进行扣分，λ
sr1
表示第七权重，λ
sr2
表示第八权重。具体地，可以根据次级状态组中的转角判断第一目标车辆与第二目标是否发生碰撞，以及第一目标车辆和各个第二目标是否已经发生碰撞。
[0066]
导航效用参数fn可以根据以下公式进行计算：
[0067]fn
＝λ
userbuser
+λ
lastbuser
ꢀꢀꢀꢀꢀꢀ
(7)
[0068]
其中，b
user
为第三布尔值，表示所述基础状态组是否与人为设置的偏好基础状态组相同，b
last
为第四布尔值，表示所述基础状态组是否与上一周期的基础状态组相同，λ
user
表示对应第三布尔值的第九权重，λ
last
表示第四布尔值的第十权重，使得到的基础状态组是平稳且连续的。具体地，人为设置的偏好基础状态组可以期望第一目标车辆不进行变道，即偏好基础状态组在转角方向上不发生变化。例如，偏好基础状态组为加速度方向为零以及转角方向为零，以保持速度与转角不变；上一周期的基础状态组为加速度方向为正以及转角方向为正，当本周期预测的基础状态组为加速度方向为正以及转角方向为正时，与偏
好基础状态组不同，与上一周期的基础状态组相同。
[0069]
需要说明的是，第一权重λ1、第二权重λ2、第三权重λ3、第四权重λ
ep
、第五权重λ
eo
、第六权重λ
sc
、第七权重λ
sr1
、第八权重λ
sr2
、第九权重λ
user
、第十权重λ
last
、第一目标车辆的偏好速度v
pref
以及偏好基础状态组可以是预先配置的数值，也可以根据实际的应用环境进行调整，本技术对此不做限制。
[0070]
在具体实施中，可以周期性地规划车辆状态。例如，每3秒为一周期，在本周期内对下一周期的车辆状态进行规划。
[0071]
在具体实施中，可以对最优次级状态组中至少一个次级状态的加速度和转角进行调整，以使加速度的方向变化频率以及转角的方向变化频率在预设范围内。例如，最优次级状态组为0～0.5秒加速度为+5m/s，0.5秒～1秒加速度为-5m/s，1秒～1.5秒加速度为+10m/s，可以调整0～1秒的加速度为0m/s。通过对最优次级状态组中的次级状态进行调整，可以使第一目标车辆的行为更符合人类的驾驶习惯，避免出现频繁加减速或者频繁变道的情况，增加第一目标车辆在道路中行驶的安全性。
[0072]
在本实施例中，根据第一状态信息与第一周围环境信息在动作搜索树中进行探索，以得到第一目标车辆的基础状态组。再使用智能驾驶模型对第一目标车辆与第二目标的驾驶情况进行模拟，在模拟过程中根据第一目标车辆与第二目标的交互情况以确定次级状态组，对目标间的交互进行考虑。再对多个次级状态组进行评分，使次级状态组的选择更加科学、准确。
[0073]
图2是本发明实施例提供的一种车辆状态规划方法的示意图。
[0074]
在图2(a)中，获取第一目标车辆a的第一状态信息与第一周围环境信息，第一周围环境信息包括第二目标b的第二状态信息以及第二目标c的第二状态信息。第一周围环境信息还包括车道线信息，当道路上的车道线难以辨认时，可使用车道线划分模型对道路进行车道线划分，以得到车道线信息。
[0075]
在图2(b)中，根据第一状态信息与第一周围环境信息对第一目标车辆a的基础状态组进行预测，以得到基础状态组1与基础状态组2。例如，基础状态组1为第一目标车辆在0～3秒内加速度为正，转角为零，即第一目标车辆在0～3秒内加速直行；基础状态组2为第一目标车辆在0～3秒内加速度为正，转角为正，即第一目标车辆在0～3秒内加速右转。
[0076]
在图2(c)中，基于图2(b)中得到的基础状态组1进行前向仿真。仿真过程中，在第一目标车辆a加速直行时，第二目标b的第二行驶状态为向右变道，则同一预测时刻第一目标车辆a的第一位置与第二目标b的第二位置之间的距离缩短。为保证第一目标车辆a与第二目标b具有安全距离，生成的次级状态组中的加速度可以比较小。例如，第二目标b向右变道时，生成的次级状态组可以是加速度为+0.5m/s，转角为0
°
。
[0077]
在图2(d)中，基于图2(b)中得到的基础状态组2进行前向仿真。仿真过程中，在第一目标车辆a加速右转时，第二目标c的第二行驶状态为减速直行，此时第一目标车辆a与第二目标c具有安全距离，可以正常向右变道。例如，生成的次级状态组可以是加速度为+10m/s，转角为45
°
。
[0078]
图3是本发明实施例提供的一种车辆距离过近时进行车辆状态规划的示意图。
[0079]
在一个具体的实施例中，在获取第一状态信息与第一周围环境信息时，第二目标d可能发生车辆失控，造成第二目标d与第一目标车辆a的距离小于预设门限。
[0080]
此时，终止执行上一周期规划完成的最优次级状态组，并控制第一目标车辆a的状态，使第一目标车辆与第二目标d的距离大于第一安全距离。例如，控制第一目标车辆a的状态为加速度-50m/s，以达到紧急制动的目的。在保证第一目标车辆与第二目标d的距离大于第一安全距离的前提下，重新获取第一状态信息与第一周围环境信息，直至第二目标d与第一目标车辆a的距离大于第二安全距离时，开始进行车辆状态的规划。
[0081]
在本实施例中，在出现意外情况导致第二目标与第一目标车辆的距离小于预设门限时，控制第一目标车辆与第二目标保持安全距离，防止与第二目标发生碰撞。再重新获取第一状态信息与第一周围环境信息，直至第二目标与第一目标车辆的距离大于第二安全距离时，开始进行车辆状态的规划。避免第一目标车辆在与第二目标距离过近时进行行驶而发生碰撞，造成进一步的交通混乱。
[0082]
如图4所示，本发明实施例还公开了一种车辆状态规划装置。车辆状态规划装置40包括：
[0083]
获取模块401，用于获取第一目标车辆的第一状态信息与第一周围环境信息，所述第一周围环境信息包括多个第二目标的第二状态信息；
[0084]
基础状态组预测模块402，用于根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组，每一基础状态组包括多个按时间排序的基础状态，所述基础状态表示所述第一目标车辆的加速度方向与转角方向；
[0085]
模拟模块403，用于分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；
[0086]
次级状态组生成模块404，用于根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，所述次级状态组包括多个按时间排序的次级状态，所述次级状态用于使所述第一目标车辆与所述第二目标具有安全距离，所述次级状态表示所述第一目标车辆的加速度与转角；
[0087]
选取模块405，用于从多个次级状态组中选取最优次级状态组。
[0088]
在具体实施中，上述车辆状态规划装置可以对应于服务器中具有车辆状态规划功能的芯片，例如soc(system-on-a-chip，片上系统)、基带芯片等；或者对应于服务器中包括具有车辆状态规划功能的芯片模组；或者对应于具有车辆状态规划功能芯片的芯片模组，或者对应于服务器。上述服务器可以是中心服务器，也可以是车载控制设备。
[0089]
关于所述车辆状态规划装置40的工作原理、工作方式的更多内容，可以参照图1至图3中的相关描述，这里不再赘述。
[0090]
关于上述实施例中描述的各个装置、产品包含的各个模块/单元，其可以是软件模块/单元，也可以是硬件模块/单元，或者也可以部分是软件模块/单元，部分是硬件模块/单元。例如，对于应用于或集成于芯片的各个装置、产品，其包含的各个模块/单元可以都采用电路等硬件的方式实现，或者，至少部分模块/单元可以采用软件程序的方式实现，该软件程序运行于芯片内部集成的处理器，剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现；对于应用于或集成于芯片模组的各个装置、产品，其包含的各个模块/单元可以都采用电路等硬件的方式实现，不同的模块/单元可以位于芯片模组的同一组件(例如芯片、电路模块等)或者不同组件中，或者，至少部分模块/单元可以采用软件程序的方式实
现，该软件程序运行于芯片模组内部集成的处理器，剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现；对于应用于或集成于终端的各个装置、产品，其包含的各个模块/单元可以都采用电路等硬件的方式实现，不同的模块/单元可以位于终端内同一组件(例如，芯片、电路模块等)或者不同组件中，或者，至少部分模块/单元可以采用软件程序的方式实现，该软件程序运行于终端内部集成的处理器，剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现。
[0091]
本发明实施例还公开了一种存储介质，所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质，所述存储介质为计算机可读存储介质，其上存储有计算机程序，所述计算机程序运行时可以执行图1至图3中所示方法的步骤。所述存储介质可以包括rom、ram、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
[0092]
本发明实施例还公开了一种终端设备，所述终端设备可以包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，所述处理器运行所述计算机程序时可以执行图1至图3中所示方法的步骤。
[0093]
本技术实施例中出现的“多个”是指两个或两个以上。
[0094]
本技术实施例中出现的第一、第二等描述，仅作示意与区分描述对象之用，没有次序之分，也不表示本技术实施例中对设备个数的特别限定，不能构成对本技术实施例的任何限制。
[0095]
应理解，本技术实施例中，所述处理器可以为中央处理单元(central processing unit，简称cpu)，该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor，简称dsp)、专用集成电路(application specific integrated circuit，简称asic)、现成可编程门阵列(field programmable gate array，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0096]
还应理解，本技术实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，简称rom)、可编程只读存储器(programmable rom，简称prom)、可擦除可编程只读存储器(erasable prom，简称eprom)、电可擦除可编程只读存储器(electrically eprom，简称eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory，简称ram)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的随机存取存储器(random access memory，简称ram)可用，例如静态随机存取存储器(static ram，简称sram)、动态随机存取存储器(dram)、同步动态随机存取存储器(synchronous dram，简称sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram，简称ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram，简称esdram)、同步连接动态随机存取存储器(synchlink dram，简称sldram)和直接内存总线随机存取存储器(direct rambus ram，简称dr ram)。
[0097]
上述实施例，可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时，上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机
指令或计算机程序时，全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质。半导体介质可以是固态硬盘。
[0098]
应理解，在本技术的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本技术实施例的实施过程构成任何限定。
[0099]
在本技术所提供的几个实施例中，应该理解到，所揭露的方法、装置和系统，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的；例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式；例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0100]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0101]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理包括，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。
[0102]
上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0103]
虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

技术特征：
1.一种车辆状态规划方法，其特征在于，包括：获取第一目标车辆的第一状态信息与第一周围环境信息，所述第一周围环境信息包括多个第二目标的第二状态信息；根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组，每一基础状态组包括多个按时间排序的基础状态，所述基础状态表示所述第一目标车辆的加速度方向与转角方向；分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，所述次级状态组包括多个按时间排序的次级状态，所述次级状态用于使所述第一目标车辆与所述第二目标具有安全距离，所述次级状态表示所述第一目标车辆的加速度与转角；从多个次级状态组中选取最优次级状态组。2.根据权利要求1所述的车辆状态规划方法，其特征在于，所述第一行驶状态表示所述第一目标车辆在各个预测时刻的第一位置和/或第一转角方向，所述第二行驶状态表示所述第二目标在各个预测时刻的第二位置和/或第二转角方向，所述根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组包括：根据在同一预测时刻的第一位置与第二位置的距离生成所述次级状态组；或者，根据在同一预测时刻的第一转角方向与第二转角方向的冲突关系生成所述次级状态组。3.根据权利要求1所述的车辆状态规划方法，所述从多个次级状态组选取最优次级状态组包括：对所述次级状态组进行评价，按照评价得分选取最优次级状态组。4.根据权利要求3所述的车辆状态规划方法，采用以下公式计算所述次级状态组的评价得分f
total
：f
total
＝λ1f
e
+λ2f
s
+λ3f
n
，f
e
表示效率性参数，f
s
表示安全性参数，f
s
表示导航效用参数，λ1表示对应效率性参数的第一权重，λ2表示对应安全性参数的第二权重，λ3表示对应导航效用参数的第三权重；所述效率性参数采用以下公式计算：δv
p
＝|v
ego-v
pref
|，δv
o
＝|v
ego-v
lead
|，其中v
ego
为所述第一目标车辆的速度，v
pref
为所述第一目标车辆的偏好速度，v
lead
为所述第一目标车辆所处车道正前方的所述第二目标的速度，λ
ep
表示第四权重，λ
eo
表示第五权重，n表示每一次级状态组中次级状态的数量，所述第一目标车辆的速度是基于所述次级状态组中的加速度计算得到的；所述安全性参数采用以下公式计算：所述安全性参数采用以下公式计算：其中b
c
为第一布尔值，用于表示模拟结束时所述第一目标车辆和各个第二目标是否已经发生碰撞，b
d
为第二布尔值，用于表示所述第一目标车辆和各个第二目标在未来预设时间段内是否发生碰撞，[v
min
,v
max
]表示安全速度范围，λ
sc
表示对应第一布尔值的第六权重，λ
sr1
表示第七权重，λ
sr2
表示第八权重，所述第一布尔值和所述第二布尔值是基于所述次级状态组中的转角计算得到的；所述导航效用参数采用以下公式计算：f
n
＝λ
user
b
user
+λ
last
b
user
，其中b
user
为第三布尔
值，表示所述基础状态组是否与人为设置的偏好基础状态组相同，b
last
为第四布尔值，表示所述基础状态组是否与上一周期的所述基础状态组相同，λ
user
表示对应第三布尔值的第九权重，λ
last
表示第四布尔值的第十权重。5.根据权利要求1所述的车辆状态规划方法，其特征在于，所述从多个次级状态组选取最优次级状态组之后包括：对所述最优次级状态组中至少一个次级状态的加速度和转角进行调整，以使加速度的方向变化频率以及转角的方向变化频率在预设范围内。6.根据权利要求1所述的车辆状态规划方法，其特征在于，在获取所述第一周围环境信息之后包括：当所述第一周围环境信息中第二目标与第一目标车辆的距离小于预设门限时，控制第一目标车辆的状态，以使所述第一目标车辆与所述第二目标的距离大于第一安全距离；重新获取第一状态信息与第一周围环境信息，直至第二目标与第一目标车辆的距离大于第二安全距离。7.根据权利要求1所述的车辆状态规划方法，其特征在于，所述根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组包括：基于所述第一状态信息构建所述第一目标车辆的动作搜索树，以及基于所述第一周围环境信息构建所述第二目标车辆的空间搜索树，所述动作搜索树的各个节点为所述第一目标车辆的基础状态，所述空间搜索树的各个节点为所述第二目标的第二状态信息，所述动作搜索树与所述空间搜索树中各个节点按照时间排列；根据所述空间搜索树的各个第二状态信息对同一时刻的所述动作搜索树的节点进行修剪，以删除导致所述第一目标车辆与所述第二目标发生碰撞的基础状态；遍历所述动作搜索树，以得到多个按时间排序的基础状态。8.根据权利要求1所述的车辆状态规划方法，其特征在于，所述根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态包括：使用自动驾驶模型模拟所述第二目标的第二行驶状态。9.一种车辆状态规划装置，其特征在于，包括：获取模块，用于获取第一目标车辆的第一状态信息与第一周围环境信息，所述第一周围环境信息包括多个第二目标的第二状态信息；基础状态组预测模块，用于根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组，每一基础状态组包括多个按时间排序的基础状态，所述基础状态表示所述第一目标车辆的加速度方向与转角方向；模拟模块，用于分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；次级状态组生成模块，用于根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组，所述次级状态组包括多个按时间排序的次级状态，所述次级状态用于使所述第一目标车辆与所述第二目标具有安全距离，所述次级状态表示所述第一目标车辆的加速度与转角；选取模块，用于从多个次级状态组中选取最优次级状态组。
10.一种服务器，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，其特征在于，所述处理器运行所述计算机程序时执行权利要求1至8中任一项所述车辆状态规划方法的步骤。11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质，所述计算机程序被处理器运行时执行权利要求1至8中任一项所述车辆状态规划方法的步骤。

技术总结
本发明公开了一种车辆状态规划方法及装置、服务器、计算机可读存储介质，所述车辆状态规划方法包括：获取第一目标车辆的第一状态信息与第一周围环境信息；根据所述第一状态信息与所述第一周围环境信息预测所述第一目标车辆的多个基础状态组；分别按照所述多个基础状态组模拟所述第一目标车辆的第一行驶状态，并根据所述第二状态信息和所述第一行驶状态模拟所述多个第二目标的第二行驶状态；根据所述第二行驶状态与所述第一行驶状态的交互生成次级状态组；从多个次级状态组中选取最优次级状态组。使用上述技术方案能够准确地对车辆的状态进行规划，使车辆在无人驾驶时安全地行驶。驶。驶。

技术研发人员：黄超朱再聪
受保护的技术使用者：上海仙途智能科技有限公司
技术研发日：2022.05.18
技术公布日：2022/11/1

转载请注明原文地址: https://tieba.8miu.com/read-6119.html

专利

最新回复(0)