用于自动驾驶系统的路径规划系统开发的平台的制作方法

专利2024-11-19  45


用于自动驾驶系统的路径规划系统开发的平台
1.相关申请的交叉引用
2.本专利申请要求于2021年4月29日提交的标题为“用于自动驾驶系统的路径规 划模块的自动开发的方法(method for automated development of a pathplanning module for an automated driving system)”的已转让给本受 让人且通过引用明确地并入本文中的第21171222号欧洲专利局申请的优先权。
技术领域
3.本公开涉及用于配备有自动驾驶系统(ads)的车辆的路径规划模块的性能评估 和开发的方法和系统。具体地,本发明涉及车辆的路径规划开发模块的闭环评估以及 其随后的更新/训练。


背景技术:

4.在过去几年中,与自主车辆相关的研究和开发活动已经呈爆发式增长,并且正在 探索许多不同的方法。越来越多的现代车辆具有高级驾驶员辅助系统(adas)以提 高车辆安全性和更普遍的道路安全性。例如可以由自适应巡航控制(acc)、防碰撞系 统、前向碰撞警告等表示的adas是可以在驾驶时帮助车辆驾驶员的电子系统。如今, 在与adas和自主驾驶(ad)领域相关联的许多技术领域内,正在进行研究和开发。 adas和ad在本文中将被称为与例如由驾驶自动化的sae j3016级别(0-5)(并且 尤其是级别4和级别5)所定义的所有不同的自动化级别相对应的通用术语自动驾驶 系统(ads)。
5.在不久的将来,ads解决方案预计将应用于大部分投放市场的新车。ads可以被 理解为各种部件的复杂组合,其能够被定义为其中车辆的感知、决策和操作由电子器 件和机械而不是人类驾驶员来执行的系统,并且能够被定义为将自动化引入道路交通。 这包括对车辆的处理、目的地以及对周围环境的了解。虽然自动化系统可以控制车辆, 但它允许人类操作员将全部或至少一些职责留给系统。ads通常组合诸如例如雷达、 激光雷达、声纳、摄像头、导航系统(例如gps)、里程表和/或惯性测量单元(imu) 的各种传感器以感知车辆的周围环境,由此高级控制系统可以解释传感信息以识别适 当的导航路径以及障碍物、自由空间区域和/或相关标志。
6.目前开发ads的许多努力围绕着将第一系统安全地投放到市场。然而,一旦实现 了这一点,以安全和有效的方式改进系统将是极为重要的,以实现成本降低以及性能 改进。通常,存在与ads(或“ads特征”)的安全性的开发和验证相关联的显著成 本,尤其是与现场试验和系统在交通中如何表现的理解相关的成本。此外,不仅从数 据存储、处理和带宽的角度来看,而且从数据安全/隐私的角度来看,在管理由配备 ads的车辆生成的大量数据以便开发和验证各种ads特征方面存在额外的挑战。
7.存在包含为了找到和执行这种安全且可靠的路径而提出的各种方法的许多不同的 研究报告,并且进一步存在致力于在给定一组不同的约束条件的情况下寻找最佳路径 的整个研究领域。分析方法集中于在给定车辆周围对象的预测和状态的情况下寻找路 径。
还存在另一类依靠机器学习或深度神经网络来完成挑选合适路径的工作的用于获 得自动驾驶车辆的路径的方法。许多当前已知的方法依赖于周围环境的详细建模,以 便在寻找最佳路径的以下优化问题的(复杂)约束集合内最终捕获这些模型。然而, 随着ads的操作情况和操作域日益复杂,寻找和执行这种“安全”路径可能被证明是 极其困难的,如果不是不可能的话。
8.此外,当提供由ads执行的路径时,通常创建一个部件或模块,该部件或模块提 供对路径和检查该路径是否可以被安全执行的另一部件的建议。第二检查器部件通常 使用启发法来实现,因为这是确定部件的完整性/安全性的少数方式之一。另一种方法 是让它停留在形式自变量或等式上。然而,基于启发的方法要求进行实施的团队了解 所有可能的情况,并且进一步要求在确定启发法时没有任何错误。如所提及的,随着 ads的操作情况和操作域日益复杂,构造可以检查路径安全性的这样完整的一组启发 法可能被证明其工作量是无法完成的。类似地,形式方法属于相同的问题,以解释所 有可能的结果。对于一些解决方案,它还仅能集成一种类型的机动(纵向或横向)来 处理对其安全区的违规行为,因为事实证明这种组合很难正式展示。
9.因此,在本领域中需要新的解决方案来促进ads的路径规划功能的开发、验证和 确认,以便能够持续地提供更安全且性能更好的系统。通常,优选地,将在对机载系 统或平台的尺寸、功耗和成本没有显著影响的情况下进行改进。


技术实现要素:

10.因此,本发明的目的是提供由车载计算系统执行的用于车辆的路径规划开发模块 的自动开发的方法、计算机可读存储介质、用于车辆的路径规划开发模块的自动开发 的装置以及包括这种装置的车辆,它们减轻、缓和或完全消除了目前已知的解决方案 的缺点中的全部或至少一些。
11.该目的通过如所附权利要求中限定的由车载计算系统执行的用于车辆的路径规划 开发模块的自动开发的方法、计算机可读存储介质、用于车辆的路径规划开发模块的 自动开发的装置以及包括这种装置的车辆来实现。术语示例性在本上下文中将被理解 为用作实例、示例或说明。
12.根据本发明的第一方面,提供了一种由车载计算系统执行的用于配备ads的车辆 的路径规划开发模块的自动开发的方法。该方法包括从路径规划开发模块获得候选路 径。路径规划开发模块被配置为基于路径规划模型和指示车辆的周围环境的数据(例 如,传感器数据、imu数据、hd地图数据、gnss数据等)来生成候选路径以供车 辆执行。该方法进一步包括获得车辆的周围环境的风险图。风险图基于车辆的致动能 力和周围环境中的自由空间区域的位置而形成,其中致动能力包括致动能力的不确定 性估计,并且自由空间区域的位置包括所估计的自由空间区域的位置的不确定性估计。 风险图包括被包括在车辆的周围环境中的多个区域段中的每一个的风险参数。此外, 风险图进一步具有时间分量,该时间分量至少在由候选路径的预测持续时间定义的持 续时间内基于自由空间区域的预测时间演变来指示区域段的风险参数的时间演变。
13.该方法进一步包括基于要与候选路径交叉的区域段的风险参数来确定候选路径的 风险值。此外,如果确定的风险值满足至少一个风险标准,则该方法进一步包括:
14.·
在输出处生成指示用于ads执行候选路径的指令的第一控制信号。
15.·
获得执行的候选路径的至少一个质量参数,其中,该至少一个质量参数指示候 选路径在执行的候选路径的质量和/或舒适度方面的性能。
16.·
基于获得的至少一个质量参数来确定指示路径规划开发模块的性能的成本函 数。
17.·
通过被配置为优化确定的成本函数的优化算法来更新路径规划模型的一个或 多个参数。
18.根据本发明的第二方面,提供了一种存储一个或多个程序的(非暂时性)计算机 可读存储介质,一个或多个程序被配置为由车载处理系统的一个或多个处理器执行, 一个或多个程序包括用于执行根据本文中所公开的实施例中的任一个的方法的指令。 对于本发明的这个方面,存在与先前讨论的本发明的第一方面类似的优点和优选特征。 对于本发明的这个方面,存在与先前讨论的本发明的第一方面类似的优点和优选特征。
19.如本文中所使用的术语“非暂时性”旨在描述排除传播电磁信号的计算机可读存 储介质(或“存储器”),但不旨在以其它方式限制短语计算机可读介质或存储器所涵 盖的物理计算机可读存储设备的类型。例如,术语“非暂时性计算机可读介质”或“有 形的存储器”旨在涵盖不必永久地存储信息的存储设备的类型,包括例如随机存取存 储器(ram)。以非暂时性形式存储在有形的计算机可访问存储介质上的程序指令和 数据可以进一步通过传输介质或可以经由通信介质(诸如网络和/或无线链路)传送的 信号(诸如电信号、电磁信号或数字信号)来传输。因此,如本文中使用的术语“非 暂时性”是对介质本身的限制(即,有形的,而不是信号),而不是对数据存储持久性 的限制(例如,ram对比rom)。
20.进一步地,根据本发明的第三方面,提供了一种用于配备ads的车辆的路径规划 开发模块的自动开发的装置。该装置包括被配置为从路径规划开发模块获得候选路径 的控制电路。路径规划开发模块被配置为基于路径规划模型和指示车辆的周围环境的 数据来生成候选路径以供车辆执行。控制电路进一步被配置为获得车辆的周围环境的 风险图,其中,风险图基于车辆的致动能力和周围环境中的自由空间区域的位置而形 成。致动能力包括致动能力的不确定性估计,并且自由空间区域的位置包括所估计的 自由空间区域的位置的不确定性估计。风险图包括被包括在车辆的周围环境中的多个 区域段中的每一个的风险参数。此外,风险图进一步具有时间分量,该时间分量至少 在由候选路径的预测持续时间定义的持续时间内基于自由空间区域的预测时间演变来 指示区域段的风险参数的时间演变。控制电路进一步被配置为基于要与候选路径交叉 的区域段的风险参数来确定候选路径的风险值,并且如果确定的风险值满足至少一个 风险标准,则控制电路进一步被配置为:
21.·
在输出处生成指示用于ads执行候选路径的指令的第一控制信号。
22.·
获得执行的候选路径的至少一个质量参数,其中,该至少一个质量参数指示候 选路径在执行的候选路径的质量和/或舒适度方面的性能。
23.·
基于获得的至少一个质量参数来确定指示路径规划开发模块的性能的成本函 数。
24.·
通过被配置为优化确定的成本函数的优化算法来更新路径规划模型的一个或 多个参数。
用计算机结合运行的软件、使用一个或多个专用集成电路(asic)和/或使用一个或多 个数字信号处理器(dsp)来实现本文中所说明的步骤、服务及功能。还将理解,当 就方法来描述本发明时,其还可以在一个或多个处理器以及耦合到一个或多个处理器 的一个或多个存储器中实现,其中一个或多个存储器存储一个或多个程序,一个或多 个程序当由一个或多个处理器执行时执行本文中公开的步骤、服务及功能。
39.在示例性实施例的以下描述中,相同的附图标记表示相同的或相似的部件。
40.在本上下文中,风险图估计并量化跨ads的周围环境(即自我车辆的周围环境) 的“风险”的视图,并且优选地包括传感器能力、检测和预测中的不确定性以及车辆 平台的可用能力中的不确定性。
41.如背景技术部分中所提及的,目前已知的用于开发和启动自主车辆的新路径规划 器的过程需要大量的人工工作,以便能够生成可以被认为是“安全”的路径。应注意, 本上下文中的术语“安全”将被理解为在概率阈值之上是统计上安全的,例如,如果 路径的事故的概率被确定为小于由安全标准定义的阈值,则路径可以被认为是安全的。 相应地,可以将术语“安全”理解为没有风险,或者更具体地,可以将“安全”理解 为“风险”的量化量度低于阈值。
42.继续,为了减轻对人工工作的这种需要,在本文中建议使用ads发现其本身所处 的当前情况的实时风险图作为检查器。风险图包括包含来自自身传感器的测量的不确 定性、对可用对象的移动的预测、新对象出现的风险以及ads在其上运行的车辆平台 的能力的所有潜在风险源。如果ads的建议路径在风险图上执行时积累的风险足够 低,则可以接受它。因此,使用风险图作为检查器将确保路径始终具有足够低的风险。
43.结果,由于生成的候选路径与风险图进行比较并且因此被认为对于执行是安全的, 因此提供了利用该候选路径的可能性,以便在闭环过程中训练负责生成这些路径的算 法,以朝着质量/舒适度参数进行优化。应注意,这里假设“路径规划开发模块”的路 径规划模型已经达到足够的成熟度水平,以便能够生成“安全”路径,使得风险图评 估主要用作故障安全,以便防止执行“不安全”路径。为了实现这种“足够的成熟度 水平”,可以例如利用如本文中所公开的“风险图”作为参考框架,并且在开环过程中 针对该参考框架来训练路径规划模型。
44.此外,风险图可以以与跨ads的新操作域进行扩展相同的步调用附加模型来扩 展,并且以这种方式提供准确的风险估计。以这种方式,风险图可以更容易维护,并 且与启发式方法相比,它进一步提供了用于检查ads的建议路径的更一般的概念。
45.更详细地,本发明建议使用风险图,该风险图捕获周围环境、检测以及预测的所 有影响以及这些周围环境的估计中的不确定性和自身车辆能力的不确定性。与将优化 问题视为受大量变量约束的复杂问题不同,这些优化问题中的大多数直接反映在风险 图中。相应地,这可以导致更易处理并且性能更好的解决方案,并且还导致更容易扩 展到新域中的解决方案。随着人们对ads在其中操作的世界的更多理解,可以附加支 持系统的模型并且将它们馈送到风险图中,以继续使用确保“安全”路径的相同方法。
46.用于形式路径检查的传统方法的主要问题之一是它们没有考虑不确定性。进一步 地,由于这些模型严重依赖于不同的参数(如制动能力)来评估所建议路径(或当前 状态)的有效性,因此这些参数是正确的是极为重要的。就本发明人所知,没有关于 如何将这些
方面结合到目前已知的模型中的其它建议。另一方面,风险图通过包括 ads的所有方面的不确定性来固有地提供这些估计中的全部。因此,与用于路径检查 的形式化方法或启发式方法相比,使用用于路径检查的风险图不仅可以降低所需的实 施努力,而且可以进一步包括ads的操作环境固有的动态不确定性。结果是更可靠的 自动路径检查和规划解决方案。
47.换句话说,与依赖于启发式方法来进行安全评估的传统路径规划解决方案相比, 风险图提供了用于风险感知路径规划的自动工具,使开发期间所需的人工劳动最小化。 进一步地,由于用于周围世界的模型将必然需要随着ads增加其能力而改进,因此风 险图也将是如此,因为风险图可以基于ads所依赖的相同模型中的大部分。此外,当 扩展到更复杂的操作情况时,模型需要到位以允许ads在那里自行运行,因此风险图 的更新版本将是容易获得的。另一方面,将需要针对操作域的每一改变来更新和开发 启发式检查器,从而使其难以维护。
48.本文中所建议的风险图方法进一步提供了在评估所建议路径的安全性时考虑环境 的所有潜在不确定性以及车辆/ads自身的能力的动态方式。与目前的方法相比,风险 图将包含允许从ads的所有部分(包括传感器、感知系统以及车辆平台和致动器)动 态估计风险的信息。这将不仅允许来自风险图的估计与静态模型相比更准确,而且还 允许所检查的路径考虑周围对象的更复杂的行为以及克服围绕静态模型的不确定性的 中心问题中的一些。风险图将来自所有源的不确定性集合在一起,以创建风险的一个 集合视图。它考虑了传感器读数、感知系统预测、对象模型(场景/行为模型)和车辆 平台能力(制动、转向等)的不确定性。
49.了解ads可以安全执行的路径是安全驱动ads的关键组成部分。在任何给定的 情况下,ads暴露于过多的风险和不确定性。对当前感知的世界状态中的每个此类风 险和不确定性进行量化为ads提供了上述“风险图”。图3至图5中示出了风险图的 示意性示例。这种风险图(其中ads周围的每个位置与风险相关联)相应地用于评估 穿过地图上的位置的风险。换言之,给定路径,风险图用于评估该路径的风险。因此, 使用风险图计算路径的安全级别(即,风险级别)。
50.图1是根据本发明的一些实施例的由车载计算系统执行的用于车辆的路径规划开 发模块的自动开发的方法100的示意性流程图表示。车辆配备有自动驾驶系统(ads), 自动驾驶系统在本上下文中包括例如由驾驶自动化的sae j3016级别(0-5)(并且尤 其是级别4和级别5)所定义的所有不同的自动化级别。换言之,术语ads涵盖高级 驾驶员辅助系统(adas)和自主驾驶(ad)两者。
51.更具体地,方法100涉及车辆的路径规划模块的闭环评估以及其随后的更新。术 语“闭环”评估也可以被称为“实时测试”,并且相应地可以被理解为对路径规划开发 模块的输出的评估,该路径规划开发模块的生成的路径旨在由车辆在真实世界场景中 执行。
52.方法100包括从路径规划开发模块获得101候选路径。术语“路径规划开发模块
”ꢀ
也可以被称为“测试中的模块”(mut),意指汽车应用的路径规划特征的“新的”(开 发中的)软件和/或硬件。换言之,路径规划模块在本上下文中可以被理解为被配置为 基于感知数据(例如,原始传感器数据或处理后的传感器数据)来生成候选路径的软 件和/或硬件,其中路径规划模块当前处于“开发中”而尚未处于“生产中”(例如, 未被验证/确认)。车辆,或者更准确地说,车辆的ads自然可以配备有“生产路径规 划器”,即路径规划模块,该路径规
路径的风险值。换言之,对获得101的候选路径的检查根据获得102的风险图来执行。
59.确定103风险值的步骤可以包括:(a)检查候选路径在当前时间实例中被认为足 够安全以供执行,和/或(b)检查所提供的路径规划开发模块的候选路径随时间推移 具有足够低的风险。在上文中标记为(a)的第一度量在本文中被称为“合计风险值”, 而在上文中标记为(b)的第二度量在本文中被称为“总风险值”。在本上下文中,术 语“合计”被认为涵盖“累积”。
60.然而,如果确定的风险值满足至少一个风险标准,即,如果获得101的候选路径 通过根据风险图的“风险检查”104,则方法进一步包括在输出处生成105指示用于 ads执行候选路径的指令的第一控制信号。更详细地,用于执行获得101的候选路径 的指令由ads的决策和控制块生成,并且适当的控制信号被发送到车辆的一个或多个 致动器,以便控制车辆的转向、加速和减速等。
61.进一步地,方法100包括获得106执行的候选路径的至少一个质量参数,其中, 至少一个质量参数指示候选路径在执行的候选路径的质量和/或舒适度方面的性能。可 应用的质量参数的一些示例包括横向加速度、纵向加速度、垂直加速度、加速度变化 率、振动、转向振荡频率、路径长度、侧倾加速度、俯仰加速度、偏航加速度、燃料 消耗以及其它乘坐质量关键性能指标(kpi)。此外,在一些实施例中,至少一个质量 参数包括至少一个威胁评估度量,诸如例如制动威胁编号(btn)、碰撞时间(ttc)、 制动时间(ttb)、车头时距和侵入后时间(pet)等。
62.方法100进一步包括:基于获得的至少一个质量参数来确定107指示路径规划开 发模块的性能的成本函数;并且通过被配置为优化确定的成本函数的优化算法来更新 108路径规划模型的一个或多个参数。这里,可以注意到,成本函数的优化不一定意 味着质量参数应始终被最小化或被最大化。例如,如果诸如btn或pet的威胁评估 度量用作成本函数中所采用的质量参数之一,则仅将该参数最小化将不是有利的。这 主要是因为由于“最安全”的操纵通常是使车辆静止不动,所以算法很可能被训练成 使车辆完全停止。因此,可以基于预定义的规范(即,min
x
(x,x
threhold
)或 max
x
(x,x
threhold
))将参数朝向特定的最大值或最小值优化。
63.在本公开中,术语成本函数、损失函数和误差函数可互换使用。如本文中所定义 的成本函数的目的相应地是提供用于更新路径规划模型的装置,以使期望的输出最大 化并且使来自路径规划模型的不期望的输出最小化。更详细地,成本函数优选地相对 于一个或多个预定义的目标(即,预定义的目标值)来设置。例如,一个或多个(预 定义的)定义的质量参数阈值可以用于形成成本函数的“目标”。换句话说,成本函数 的目的是使与候选路径相关联的一个或多个质量参数值最小化或最大化,但优选地仅 将其最小化或最大化直到特定的点。如以上所提及的,这是为了避免其中路径规划被 优化到“实现”“最安全”的选项是静止不动的水平(或至少非常保守地“驾驶”,这 将不利于用户体验)的潜在情况。然而,也可以对优化算法施加一些固定的约束(例 如,车辆必须从a移动到b)以避免这种情况。
64.因此,在一些实施例中,一个或多个质量参数可以形成优化算法的约束,其中, (形成约束的)这种质量参数的示例可以是如以上所提及的路径完成。换句话说,优 化算法进一步被配置为采用一个或多个质量参数作为优化中的约束。附加地或可替代 地,优化算
法可以进一步被配置为采用至少一个风险标准(和/或一些威胁评估度量) 作为优化中的约束。
65.换言之,可以使用性能和安全相关函数的组合来确定/定义107成本函数。为了结 合安全性,可以使用路径的所确定的风险值(合计和/或总计)。另外,质量/舒适度以 及其它性能相关函数可以包括燃料消耗、舒适度水平、所使用的加速度变化率和/或加 速度等。这些不同的方面可以被包括在“学习”过程中,作为成本函数中的加权组合, 或者作为对优化问题/算法的约束。
66.此外,等效的解决方案将是在评估中确定107对应的“报酬函数”,以通过被配置 为使所确定的“报酬函数”最大化的优化算法来更新108路径规划模型的一个或多个 模型参数。
67.返回到风险值的确定103,在一些实施例中,确定103风险值的步骤包括基于要 与候选路径交叉的一组区域段的风险参数来确定109候选路径的合计风险值。因此, 至少一个风险标准包括合计风险阈值。此外,仅在确定109的合计风险值低于合计风 险阈值时才执行在输出处生成105指示用于ads执行候选路径的指令的第一控制信号 的步骤。此外,在一些实施例中,确定109合计风险值的步骤包括合计110要与候选 路径交叉的一组区域段的风险参数。
68.进一步地,根据一些实施例,确定103风险值的步骤进一步包括基于与至少一条 先前执行的路径交叉的一组区域段的风险参数来确定111路径规划开发模块的总风险 值。这里,与至少一条先前执行的路径交叉的该组区域段与先前获得的与该至少一条 先前执行的路径相同时期的风险图相关联。换言之,对于每条先前执行的路径,属于 特定路径的风险图的一组区域段被用于估计总风险值。应注意,术语“执行的路径
”ꢀ
将被广义地解释且包括“路径的至少一部分”。如本领域技术人员容易理解地,路径长 度可以取决于各种因素,其执行也可以取决于各种因素。更详细地,虽然一些人可能 认为仅在整个规划范围的“完整”路径被执行时才执行路径,但是另一些人可能认为 (以特定的采样率)执行的“完整路径”的每个部分构成单独的“执行的路径”。然而, 本文中使用的措辞“执行的路径”涵盖这两种解释。附加地,应注意,如果不存在“先 前执行的路径”——即,正被评估的候选路径是驾驶会话的第一路径,则总风险可以 被忽略为该“第一”实例的度量,或者被设置为低于相关联的阈值的预定义的(开始) 值。
69.此外,至少一个风险标准包括总风险阈值,并且仅在总风险值低于总风险阈值时 才执行在输出处生成105指示用于ads执行候选路径的指令的第一控制信号的步骤。
70.进一步地,在一些实施例中,确定111总风险值的步骤包括对与至少一条先前执 行的路径交叉的一组区域段的风险参数求平均值112,以便确定115路径规划开发模 块的平均风险暴露,其中平均风险暴露定义总风险值。
71.如前所述,与至少一条先前执行的路径交叉的该组区域段与先前获得的与该至少 一条先前执行的路径相同时期的风险图相关联。
72.还进一步地,在一些实施例中,对风险参数求平均值的步骤包括对于每个时间样 本:
73.·
基于自先前时间样本以来与最近执行的候选路径交叉的一组区域段来确定113 路径规划开发模块的当前风险值。
74.·
通过将当前风险值与先前时间样本的先前计算的复合风险值求和来确定114当 前复合风险值。相应地,在一些实施例中,先前复合风险值可以被定义为与已经执行 的路径交叉的区域段的风险参数的合计值。
75.·
通过将当前复合风险值除以直到且包括当前时间样本为止所使用的样本的总 数量来确定115平均风险暴露。这里,样本的总数量可以是“先前执行的路径的总数 量”。
76.换言之,对于每个时间样本(在已经选择了供执行的路径之后),通过根据该时间 实例处的风险图来合计与该规划路径交叉的区域段的风险参数来计算该时间实例的风 险(即,之前描述的合计风险值)。然后,将该“当前风险值”与执行的每条路径的先 前计算的风险值求和,以获得“当前复合风险值”。应注意,这些先前计算的风险值根 据这些时间样本的风险图来确定。然后通过将“当前复合风险值”除以直到且包括当 前时间样本为止所使用的样本的总数量来计算总风险值。
77.继续,在一些实施例中,方法100包括从车辆的生产平台获得备用路径。相应地, 生产平台包括被配置为生成备用路径的验证过的/确认过的路径规划开发模块。然后, 如果确定的风险值未能满足至少一个风险标准,则方法100包括在输出处生成116第 二控制信号以执行获得的备用路径,并且可选地,还包括将路径规划开发模块停用 117。相应地,如果路径规划开发模块不能提供足够安全的路径,则备用路径可以被理 解为后退选项,因此ads被配置为提供备用路径,使得ads始终有“安全选项”可 以依靠。备用路径可以由生产平台的路径规划模块或用于为车辆生成备用路径的任何 其它专用模块来提供。
78.还进一步地,在一些实施例中,方法100进一步包括:如果确定的风险值未能满 足至少一个风险标准,则在输出处生成第二控制信号,以启用车辆的生产平台的路径 规划器,用于生成要由车辆执行的候选路径。换言之,如果合计风险超过阈值和/或如 果总风险超过阈值,则车辆可以被配置为返回依赖生产平台的路径规划模块来生成车 辆要执行的路径。
79.进一步地,在联合学习方案中,多个车辆中的每个车辆的更新108的参数可以有 利地整合在中央单元或云单元中,由此可以将“全局更新”推送到整个车辆车队。因 此,在一些实施例中,方法100进一步包括将路径规划模型的一个或多个更新108的 参数传输到远程实体(例如,后台或车队管理系统)。此外,方法100可以包括从远程 实体接收路径规划模块的路径规划模型的一组全局更新的参数。该组全局更新的参数 相应地基于从包括对应的路径规划开发模块的多个车辆获得的信息。然后,方法100 可以包括基于接收到的该组全局更新的参数来更新107路径规划模块的路径规划模 型。
80.路径规划模型的更新或训练可以在车辆行驶时或当车辆静止时以指定的更新频率
ꢀ“
实时”地执行。在后一种情况下,并且根据一些实施例,来自成本函数的输出可以 被存储在适当的数据存储介质中,并且稍后在更“严格的”更新过程(例如,在行程 结束时或者在车辆正在充电时)中使用。可替代地,模型参数仅在远程实体(即,后 台)处被更新,因此来自成本函数的输出被发送到远程实体,在远程实体处它们在整 个车辆车队中整合,并且随后以全局更新的模型参数的形式被推送到每个车辆。然而, 在替代实施例中,用于形成成本函数的质量参数被中间地合计和存储,由此成本函数 基于合计的数据来确定。
81.可选地,用于执行这些功能的可执行指令被包括在非暂时性计算机可读存储介质 或者被配置为由一个或多个处理器执行的其它计算机程序产品中。
82.图2是根据本发明的实施例的用于配备ads的车辆的路径规划开发模块210的自 动开发的装置或系统10的示意性框图表示。一般而言,图2通过暴露于车辆周围环境 中的事件、暴露于路径评估过程以及进一步暴露于“后台”2中的传输和随后的整合 而描绘了信息流。装置或系统10包括被配置为执行本文中所公开的方法的功能的各种 控制电路,其中功能可以被包括在被配置为由控制电路执行的非暂时性计算机可读存 储介质或其它计算机程序产品中。图2用于通过描绘各种“模块”来更好地说明本发 明,“模块”中的每一个链接到前面描述的一个或多个特定功能。
83.应注意,由路径开发模块210生成并在“风险评估模块”230中比较的“候选路 径”可以包括多条候选路径。
84.系统200具有路径规划开发模块210,路径规划开发模块210被配置为基于路径 规划模型和指示车辆的周围环境的数据(诸如例如由车辆的感知系统201生成的感知 数据)来生成车辆的候选路径。相应地,感知系统201被配置为基于在时间段期间从 一个或多个车载传感器获得的传感器数据来生成感知输出。传感器数据可以例如从雷 达设备、激光雷达设备、摄像头和超声传感器等中的一个或多个输出。换言之,“感知 系统”(即,生产平台的感知系统)在本上下文中将被理解为负责从诸如摄像头、激光 雷达和雷达、超声传感器的机载传感器获取原始传感器数据并且将该原始数据转换成 包括其状态估计和预测的场景理解的系统。
85.进一步地,车辆的生产平台/系统被配置为提供用于评估候选路径的参考框架。参 考框架被配置为当候选路径被应用于参考框架中时指示与候选路径相关联的一个或多 个风险值。这里,参考框架是由风险图编译模块220生成的风险图的形式。
86.风险图编译模块220被配置为基于车辆的致动能力和周围环境中的自由空间区域 的位置来生成风险图。致动能力包括致动能力的不确定性估计,并且自由空间区域的 位置包括自由空间区域的估计位置的不确定性估计。换言之,风险图编译器220被配 置为根据包括来自感知系统201的不确定性以及由车辆平台203报告的能力和不确定 性(例如转向能力、制动能力等)的检测和预测来编译风险图。风险图可以被理解为 车辆的周围环境的具有多个定义的区域段的虚拟图,每个定义的区域段与对应的风险 参数相关联。
87.此外,风险图进一步具有时间分量,该时间分量至少在由候选路径的预测持续时 间定义的持续时间内基于自由空间区域的预测时间演变来指示区域段的风险参数的时 间演变。预测时间演变可以例如基于感知数据以及一个或多个预测模型(例如轨迹预 测、统计模型等)。
88.根据说明性示例,获得的致动能力可以包括制动能力以及获得的制动能力的不确 定性估计或“误差容限”的类型。例如,如果获得的制动能力指示车辆能够在150米 的距离内完全停止(假设紧急制动致动),则该估计的不确定性估计可以包括
±
15米 (即,
±
10%)的误差容限。如先前所提及的,致动能力可以从一个或多个致动参数的 统计模型给出,其中每个致动参数的不确定性估计可以由这些统计模型中的标准偏差 来定义。
89.进一步地,风险图编译器220(例如,从车辆的感知系统201)接收车辆的周围环 境中的自由空间区域的位置,其中获得的自由空间区域的位置包括自由空间区域的估 计位置的不确定性估计。如先前所提及的,自由空间区域在本上下文中可以被理解为 自我车辆的周围环境中的不存在对象(例如,其它车辆、行人、障碍物、动物、自行 车、静态对象等)的
区域。因此,获得的自由空间区域的位置可以包括外部对象(静 态对象和动态对象)的确定位置、动态对象的确定轨迹以及该确定的不确定性的估计 (即,自由空间区域的确定位置的风险实际上不是自由的)。进一步地,在一些实施例 中,自由空间区域的位置进一步包括“可驾驶区域”的位置的估计,其中除了不存在 对象的区域(以及相关联的不确定性)的估计之外,估计还包括道路表面或“道路状
”ꢀ
表面的位置/存在(以及相关联的不确定性)。
90.将编译后的风险图与候选路径一起提供给风险评估模块230,风险评估模块230 被配置为根据生成的风险图评估候选路径在对应时间段内的“安全性”。换言之,风险 评估模块230被配置为基于要与候选路径交叉的区域段的风险参数来确定候选路径的 风险值。如先前所提及的,风险值可以基于两个度量(即,合计风险值和总风险值) 来评估,每个度量分别由合计风险估计器231和总风险估计器232来确定。更详细地, 估计器231、232都被配置为根据一个或多个标准来评估候选路径的风险,并且如果候 选路径满足标准,则第一控制信号被生成,其中第一控制信号指示用于ads执行候选 路径的指令。
91.因此,可以通过简单的归纳变元来确定安全性。更具体地,如果假设车辆现在处 于足够安全的状态并且提供的路径(根据风险图)被评估为具有足够低的风险,则随 后将以风险图已经示出为足够安全的状态结束,因此然后可以返回到变元的开始处。 进一步地,“风险图方法”还可以允许捕获其中风险在连续路径上变化的情况(这应在 总风险估计中捕获,并且路径规划开发模块的评估可以至少暂时地停止)。
92.继续,一旦候选路径已经通过了风险/安全性评估,就将信号发送到ads的控制 块202,控制块202被配置为指示车辆平台执行候选路径。应注意,候选路径可以直 接从路径规划开发模块发送到控制块202,而风险评估模块230简单地向控制块202 提供确认信号。然而,在一些示例实施例中,路径开发模块210与“生产路径规划器
”ꢀ
一起是ads的控制块202内的“一部分”或“子模块”。然而,为了阐明本发明,这 里分别图示了诸如路径开发模块210的一些模块/功能。如本文中所图示和描述的感知 模块201、控制块202和车辆平台203块可以被理解为“ads”或“生产平台/系统
”ꢀ
的部分/块/模块/系统。
93.当路径正被执行时,或者当路径已被执行时,路径评估引擎240被配置为获得执 行的候选路径的至少一个质量参数,其中至少一个质量参数指示候选路径在执行的候 选路径的质量和/或舒适度方面的性能。质量参数例如可以包括外部质量参数以及内部 质量参数。在本上下文中,外部质量参数可以被理解为指示基于从车辆的感知系统201 获得的数据的路径的感知质量的参数。这可以例如包括到外部对象的距离、到道路边 缘的距离、到车道标记的距离、车道位置、驾驶员监控系统(dms)数据以及各种威 胁评估度量。在本上下文中,内部质量参数可以被理解为指示基于从车辆的imu或其 它“内部”传感器获得的数据的路径的感知质量的参数。这可以例如包括横向加速度、 纵向加速度、垂直加速度、加速度变化率、侧倾加速度、俯仰加速度、偏航加速度和 燃料/能量消耗。
94.路径评估引擎240进一步被配置为基于获得的至少一个质量参数来确定指示路径 规划开发模块的性能的成本函数。成本函数随后被提供给学习引擎250,学习引擎250 被配置为通过被配置为优化确定的成本函数的优化算法来更新路径规划模型的一个或 多个参数。此外,学习引擎250可以被配置为将路径规划模块的路径规划模型的一个 或多个更新的参数发送到远程实体2,并且然后从远程实体接收路径规划模块的路径 规划模型的一组全局更新的参数。该组全局更新的参数基于从包括对应的路径规划模 块的多个车辆获得
的信息。此后,学习引擎75可以基于接收到的该组全局更新的参数 来更新路径规划模块的路径规划模型。这可以被解释为在整个车辆车队中的“整合
”ꢀ
过程。
95.路径规划开发模块的路径规划模型可以被更新,直到达到预定义的成熟度水平或 达到学习的饱和度,因此它可以代替“生产路径规划器”。例如,这可以通过对模型参 数的新更新来指示,这些新更新导致模型参数围绕某个静止点的振荡。可替代地,或 者附加地,可以考虑用路径规划开发模块设置用于“足够的行驶里程”的阈值,并且 一旦达到该阈值(同时可能满足一个或多个其它的活动和条件),则可以断定该模型足 够成熟以代替当前使用的“生产路径规划器”。
96.图3和图4是根据本发明的实施例的两个连续的时间步长处的风险图40的两个示 意性俯视图图示,其中一些示例部件41-46”对风险图40有贡献。此外,在风险图40 中指示自我车辆的规划执行路径47a-47b。更详细地,虚线箭头指示来自先前时间实例 /样本的“候选路径”47a,并且当前候选路径47b由图4中车辆前方的箭头指示。
97.进一步地,风险图40包括指示车辆41的包括估计制动能力43的不确定性估计 43’、43”的估计制动能力43的信息。进一步地,风险图40包括自我车辆在地图中的 地理位置41、地理位置41的不确定性估计42、外部对象44、46的位置、外部对象的 位置的不确定性44’、44”、46’、动态对象44的轨迹45以及轨迹45的不确定性45’、 45”。所估计的不确定性可以例如基于模型(预定义的或自学习/机器学习)来计算, 该模型定义了从车辆的传感器(例如,摄像头、雷达、激光雷达、超声传感器等)提 供的测量中的容差或误差容限。由此,形成的风险图40还考虑了由例如传感器制造容 差和噪声等引起的自我车辆的世界观的这种测量中固有的不确定性。相应地,使得整 个风险估计更准确和可靠,从而更准确地反映车辆的ads的实际风险暴露。然而,在 一些实施例中,如本领域技术人员容易理解地,所估计的不确定性固有地由生产平台 的感知系统提供,并且随后被并入生成的风险图40中。
98.图5是根据本发明的实施例的相对于图4中描绘的风险图的在后续时间步长/样本 处的风险图的示意性俯视图图示,其中区域段51以网格50的形式指示。如先前所描 述的,为了确定候选路径47的合计风险值,可以对与跟规划路径47交叉52的区域段 相关联的风险值求和,和/或形成与跟规划路径47交叉52的区域段相关联的风险值的 平均值。
99.此外,图5的左下角示出了风险图的示意性俯视图,并且用于图示根据本发明的 一些实施例可以如何确定总风险值。更详细地,描述了延伸通过风险图40的候选路径 47,风险图40进一步具有重叠网格框架50,以便例示如何形成区域段。如先前所描 述的,风险图40具有多个区域段51,每个区域段与风险参数相关联,风险参数指示 如果路径要与相关联的区域段交叉则发生事故事件的概率和违反预定义的安全阈值的 概率中的至少一个。风险参数的“值”在每个框51中由框51中的图案指示。相应地, 风险图40描绘了特定的“高风险”区域段44、“低风险”区域段43以及它们之间的 值。
100.候选路径47的风险(即,与候选路径相关联的风险值)可以使用风险图40通过 一种或多种方式来评估。例如,当候选路径47在风险图40上执行时,可以使用候选 路径47的合计风险(即,风险图上路径的积分)。相应地,可以合计与候选路径47 交叉52的区域段51的风险值,以便得出候选路径47的合计风险或平均风险。
101.关于总风险,驾驶的总风险可以通过将每条规划和执行的单独路径的风险相加并 且随驾驶时间进行归一化来获得。可替代地,如果在整个驾驶中使用等距时间步长, 则规
划路径的合计风险可以通过规划路径的数量来归一化。总风险因此可以被示意性 地描述为:
[0102][0103]
其中,t是在(到目前为止)所考虑的驾驶期间的总驾驶时间,并且积分用于解释每 条规划路径的风险的更精确的计算,而不是如以上示例中所提到的仅对交叉的网格框 的风险参数求和。应注意,等式(1)中的积分是路径积分,其中,参数(x)是沿着 执行的路径取得的。此外,通过考虑被包括在风险计算本身中的样本的数量,系统可 以提供路径规划开发模块已经暴露于的总风险的连续估计(例如,每时间单位)。因此, 总风险以及先前计算中使用的样本的数量被反馈以用于下一迭代以实现总风险。
[0104]
换言之,对于每个时间样本(在已经选择了供执行的路径之后),通过根据该时间 实例处的风险图来合计与该规划路径交叉的区域段的风险参数来计算该时间实例的风 险(即,当前风险值)。然后,将该“当前风险值”与执行的每条路径的先前计算的风 险值求和,以获得“当前复合风险值”。应注意,这些先前计算的风险值根据这些时间 样本的风险图来确定。然后通过将“当前复合风险值”除以直到且包括当前时间样本 为止所使用的样本的总数量来计算总风险值。
[0105]
然而,即使它可能是隐含的,因为总风险被反馈到总风险估计器,所以在新的“当 前风险值”被添加到用于计算总风险的样本的数量之前,存在将先前计算的总风险与 用于计算总风险的样本的数量相乘的附加步骤。这在以下等式(2)和(3)中更正式 地呈现。
[0106][0107][0108]
这里,tr
t
表示在时间实例t的总风险值;cr
t
表示当前复合风险值,即直到且包括时 间实例t为止ads“已经暴露于”的风险参数的合计总和;并且t
t
表示用于计算直到
[0109]
且包括时间实例t为止的当前复合风险值的样本的总数量。等式(3)描述了先前提及 的过程,其中,在将先前时间实例的总风险(即,反馈的总风险)加到“当前风险值
”ꢀ
(pr
t+1
)之前,将先前时间实例的总风险(即,反馈的总风险)与用于计算总风险的 样本的数量相乘。pr
t+1
表示时间实例t+1处的规划路径的风险值。
[0110]
相应地,当车辆操纵通过所形成的风险图时,可以获得车辆在那些操纵期间已经 暴露于的风险的周期性地/连续地更新的和定量的估计。通过在整个驾驶中连续地/周期 性地估计总风险,可以进一步判断路径规划开发模块是否违反了安全要求中的任何一 个。这对于级别4以上(根据驾驶自动化的sae j3016级别)的ads是尤其有利的, 因为它必须适应要执行的(非预期的)“高风险”路径的需要,因为ads的责任是在 其中当ads处于活动状态时/ads是活动状态的所有情况下驾驶车辆。然而,如果风 险水平持续升高到可接受的水平之上,则应确认这一点并且应采取适当的行动,诸如 要求驾驶员收回或脱离路径规划开发模块以避免事故。
[0111]
因此,返回到图3至图4的系列,以下内容作为根据本发明的实施例的如何确定 总风险值以及风险值如何随时间变化的示例。图3表示在第一时间实例t的风险图40。 相应地,为了计算总风险,车辆的控制系统被配置为基于与当前规划路径47a交叉的 一组区域段来计算ads(或路径规划开发模块)的当前风险值。在本示例中,当前风 险值基于与当前规划路径47a交叉的一组区域段而被假设为10-8
。由于不存在先前计 算的总风险值或复合风险值,因此当前风险值形成时间t处的总风险值。
[0112]
继续转到图4,其表示在随后的第二时间实例t+1处的风险图40。这里,已经规 划并选择了新的路径47b用于执行。类似地,ads的当前风险值基于与当前规划路径 47b交叉的一组区域段来确定。在此时间实例,假设当前风险值是10-7
。相应地,通过 将当前风险值与先前时间样本的先前计算的复合风险值求和来确定当前复合风险值, 由此通过将当前复合风险值除以直到且包括当前时间样本为止所使用的样本的总数量 来确定在时间t+1的总风险值。因此,时间t+1处的总风险值由下面的等式(4)给出。
[0113][0114]
进一步地,在随后(未描绘的场景)中,风险图40处于随后的第三时间实例t+2。 与上述相同的过程一起,假设第三时间实例处的当前风险值为10-7
,并且利用等式(3), 时间t+2处的总风险值由下面的等式(5)给出。
[0115][0116]
相应地,如先前所例示的,“总风险值”提供了对路径规划开发模块在整个驾驶中 的风险暴露的或多或少的连续估计,并且还提供了风险暴露如何随时间发展。如先前 所提及的,与其它现有方法相反,该方法提供了无风险与碰撞之间的连续测量,以评 估自动/自主车辆的性能。如本文中所呈现的,总风险的估计导致对路径规划开发模块 (以及扩展地,车辆及其乘员)已经暴露于的风险的细粒度测量。不仅能够增加没有 事故的小时数,还可以比较各个驾驶小时数。
[0117]
图6是根据本发明的实施例的包括用于配备ads的车辆的路径规划开发模块的自 动开发的装置10的车辆1的示意性侧视图。车辆1进一步包括感知模块/系统6(即, 生产平台的感知系统)和定位系统5。定位系统5被配置为监控车辆的地理位置和航 向,并且可以是诸如gps的全球导航卫星系统(gnss)的形式。然而,定位系统可 以可替代地被实现为实时运动(rtk)gps,以便提高精确性。
[0118]
更详细地,感知模块/系统6可以指任何公知的系统和/或功能,该系统和/或功能 例如被包括在车辆1的一个或多个电子控制模块和/或节点中,适于和/或被配置为解释 与车辆1的驾驶相关的传感信息,以识别例如障碍物、车辆车道、相关标志、适当的 导航路径等。因此,结合传感信息,例示性的感知系统6可以适合于依赖于和获得来 自多个数据源(诸如汽车成像、图像处理、计算机视觉和/或车内联网等)的输入。这 种示例性的传感信息可以例如从被包括在车辆1中和/或设置在车辆1上的一个或多个 可选的周围环境检测传感器6a-6c导出。周围环境检测传感器6a-6c可以由适于感测和 /或感知车辆1的周围环境和/或行踪的任何任意传感器来表示,并且可以例如指雷达、 激光雷达、声纳、摄像头、导航系统(例如gps)、里程表和/或惯性测量单元中的一 个或多个中的一个或组合。
[0119]
装置10包括一个或多个处理器11、存储器12、传感器接口13和通信接口14。 处理器11也可以被称为控制线路11或控制电路11。控制电路11被配置为执行存储 在存储器12中的指令,以执行根据本文中公开的任一实施例的用于车辆1的路径规划 模块的自动开发的方法f。换句话说,装置10的存储器12可以包括用于存储计算机 可执行指令的一个或多个(非暂时性)计算机可读存储介质,计算机可执行指令在由 一个或多个计算机处理器11执行时例如可以使计算机处理器11执行本文中描述的技 术。存储器12可选地包括高速随机存取存储器,诸如dram、sram、ddr ram或 其它随机存取固态存储器设备;并且可选地包括非易失性存储器,诸如一个或多个磁 盘存储设备、光盘存储设备、闪存设备或其它非易失性固态存储设备。
[0120]
装置10包括被配置为从路径规划开发模块获得候选路径的控制电路11。路径规 划开发模块被配置为基于路径规划模型和指示车辆的周围环境的数据来生成候选路径 以供车辆执行。
[0121]
控制电路11进一步被配置为获得车辆的周围环境的风险图,其中,风险图基于车 辆的致动能力和周围环境中的自由空间区域的位置而形成。致动能力包括致动能力的 不确定性估计,并且自由空间区域的位置包括自由空间区域的估计位置的不确定性估 计。风险图包括被包括在车辆的周围环境中的多个区域段中的每一个的风险参数。此 外,风险图进一步具有时间分量,该时间分量至少在由候选路径的预测持续时间定义 的持续时间内基于自由空间区域的预测时间演变来指示区域段的风险参数的时间演 变。
[0122]
控制电路11进一步被配置为基于要与候选路径交叉的区域段的风险参数来确定 候选路径的风险值,并且如果确定的风险值满足至少一个风险标准,则控制电路11 进一步被配置为:
[0123]
·
在输出处生成指示用于ads执行候选路径的指令的第一控制信号。
[0124]
·
获得执行的候选路径的至少一个质量参数,其中至少一个质量参数指示候选路 径在执行的候选路径的质量和/或舒适度方面的性能。
[0125]
·
基于获得的至少一个质量参数来确定指示路径规划开发模块的性能的成本函 数。
[0126]
·
通过被配置为优化确定的成本函数的优化算法来更新路径规划模型的一个或 多个参数。
[0127]
进一步地,车辆1可以经由例如(例如用于检索地图数据的)无线链路连接到一 个(些)外部网络20。相同的或一些其它的无线链路可以被用于与车辆附近的其它车 辆2或与本地基础设施元件通信。蜂窝通信技术可以被用于诸如到外部网络的长距离 通信,并且如果所使用的蜂窝通信技术具有低时延,则它还可以被用于车辆之间、车 辆到车辆(v2v)之间和/或车辆到基础设施(v2x)之间的通信。蜂窝无线电技术的 示例是gsm、gprs、edge、lte、5g和5g nr等,还包括未来的蜂窝解决方案。 然而,在一些解决方案中,使用中到短距离通信技术,诸如无线局域网(lan),例如 基于ieee 802.11的解决方案。etsi正致力于用于车辆通信的蜂窝标准,并且例如5g 由于低时延以及高带宽和通信信道的有效处理而被认为是合适的解决方案。
[0128]
以上已经参考具体实施例呈现了本发明。然而,除了以上描述的实施例之外的其 它实施例也是可能的并且在本发明的范围内。在本发明的范围内,可以提供与以上描 述的
方法步骤不同的、通过硬件或软件执行该方法的方法步骤。因此,根据示例性实 施例,提供了一种非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质存 储一个或多个程序,该一个或多个程序被配置为由车辆控制系统的一个或多个处理器 执行,该一个或多个程序包括用于执行根据以上讨论的实施例中的任一个实施例的方 法的指令。可替代地,根据另一示例性实施例,云计算系统可以被配置为执行本文中 呈现的任何方法。云计算系统可以包括分布式云计算资源,该分布式云计算资源在一 个或多个计算机程序产品的控制下联合地执行本文中呈现的方法。
[0129]
一般而言,计算机可访问介质可以包括任何有形的或非暂时性存储介质或存储器 介质,诸如电子介质、磁性介质或光学介质(例如经由总线耦合到计算机系统的磁盘 或cd/dvd-rom)。如本文中所使用的,术语“有形的”和“非暂时性”旨在描述排 除传播电磁信号的计算机可读存储介质(或“存储器”),但不旨在以其它方式限制短 语计算机可读介质或存储器所涵盖的物理计算机可读存储设备的类型。例如,术语“非 暂时性计算机可读介质”或“有形的存储器”旨在涵盖不必永久地存储信息的存储设 备的类型,包括例如随机存取存储器(ram)。以非暂时性形式存储在有形的计算机 可访问存储介质上的程序指令和数据可以进一步通过传输介质或可以经由通信介质 (诸如网络和/或无线链路)传送的信号(诸如电信号、电磁信号或数字信号)来传输。
[0130]
(与装置10相关联的)一个(些)处理器11可以是或包括用于进行数据或信号 处理或者用于执行存储在存储器12中的计算机代码的任何数量的硬件部件。装置10 具有相关联的存储器12,并且存储器12可以是用于存储数据和/或计算机代码的一个 或多个设备,该数据和/或计算机代码用于完成或促进本说明书中描述的各种方法。存 储器可以包括易失性存储器或非易失性存储器。存储器12可以包括数据库部件、对象 代码部件、脚本部件或用于支持本说明书的各种活动的任何其它类型的信息结构。根 据示例性实施例,任何分布式的或本地的存储器设备可以与本说明书的系统和方法一 起使用。根据示例性实施例,存储器12(例如,经由电路或任何其它有线连接、无线 连接或网络连接)可通信地连接到处理器11,并且包括用于执行本文中描述的一个或 多个过程的计算机代码。
[0131]
应理解,传感器接口13还可以提供直接地或经由车辆中的专用传感器控制电路6 来获取传感器数据的可能性。通信/天线接口14可以进一步提供借助于天线8将输出 发送到远程位置(例如远程操作者或控制中心)的可能性。此外,车辆中的一些传感 器可以使用本地网络设置(诸如can总线、i2c、以太网和光纤等)与系统10通信。 通信接口14可以被布置成与车辆的其它控制功能通信,并且因此还可以被视为控制接 口;然而,可以提供单独的控制接口(未示出)。车辆内的本地通信还可以是具有诸如 wifi、lora、zigbee、蓝牙或类似的中/短程技术的协议的无线类型。
[0132]
因此,应理解,描述的解决方案的部分可以在车辆中、在位于车辆外部的系统中 或者在车辆内部和外部的组合中实施;例如在与车辆通信的服务器中实施,即所谓的 云解决方案。例如,数据可以被发送到外部系统,并且该系统执行用于评估候选路径 的步骤。实施例的不同特征和步骤可以以不同于所描述的组合的其它组合来组合。
[0133]
应注意,词语“包括”并不排除所列出的元件或步骤之外的其它元件或步骤的存 在,并且元件之前的词语“一”并不排除多个这种元件的存在。应进一步注意,任何 附图标记都不限制权利要求的范围,本发明可以至少部分地借助于硬件和软件两者来 实现,并且
若干“装置”或“单元”可以由硬件的相同项来表示。
[0134]
尽管附图可以示出方法步骤的特定顺序,但是步骤的顺序可以与所描绘的顺序不 同。另外,两个或更多个步骤可以同时地或部分同时地被执行。例如,获得候选路径 的步骤和获得风险图的步骤可以基于特定实现而互换。这种变化将取决于所选择的软 件系统和硬件系统以及设计者的选择。所有这些变化都在本发明的范围内。同样地, 软件实施方案可以利用具有基于规则的逻辑和其它逻辑的标准编程技术来完成,以完 成各种连接步骤、处理步骤、比较步骤和判定步骤。以上提及的和描述的实施例仅作 为示例给出,而不应限制本发明。在描述的专利实施例中所要求保护的本发明的范围 内的其它解决方案、用途、目的和功能对于本领域技术人员来说是显而易见的。

技术特征:
1.一种由车载计算系统执行的用于车辆的路径规划开发模块的自动开发的方法,其中,所述车辆配备有自动驾驶系统ads,所述方法包括:从所述路径规划开发模块获得候选路径,其中,所述路径规划开发模块被配置为基于路径规划模型和指示所述车辆的所述周围环境的数据来生成所述候选路径以供所述车辆执行;获得所述车辆的周围环境的风险图,其中,所述风险图基于所述车辆的致动能力和所述周围环境中的自由空间区域的位置而形成,所述致动能力包括所述致动能力的不确定性估计,并且所述自由空间区域的位置包括所估计的自由空间区域的位置的不确定性估计;其中,所述风险图包括被包括在所述车辆的所述周围环境中的多个区域段中的每一个的风险参数;其中,所述风险图进一步具有时间分量,所述时间分量至少在由所述候选路径的预测持续时间定义的持续时间内基于所述自由空间区域的预测时间演变来指示所述区域段的所述风险参数的时间演变;基于要与所述候选路径交叉的所述区域段的所述风险参数来确定所述候选路径的风险值;并且如果所确定的风险值满足至少一个风险标准,则所述方法进一步包括:在输出处生成指示用于所述ads执行所述候选路径的指令的第一控制信号;获得所执行的候选路径的至少一个质量参数,其中,所述至少一个质量参数指示所述候选路径在所执行的候选路径的质量和/或舒适度方面的性能;基于所获得的至少一个质量参数来确定指示所述路径规划开发模块的性能的成本函数;以及通过被配置为优化所确定的成本函数的优化算法来更新所述路径规划模型的一个或多个参数。2.根据权利要求1所述的方法,其中,所述至少一个质量参数包括横向加速度、纵向加速度、垂直加速度、加速度变化率、路径长度、侧倾加速度、俯仰加速度、偏航加速度和燃料消耗中的至少一个。3.根据权利要求1所述的方法,其中,确定所述风险值的步骤包括:基于要与所述候选路径交叉的一组区域段的所述风险参数来确定所述候选路径的合计风险值;其中,所述至少一个风险标准包括合计风险阈值,并且其中,仅在所述合计风险值低于所述合计风险阈值时才执行在输出处生成指示用于所述ads执行所述候选路径的指令的所述第一控制信号的步骤。4.根据权利要求3所述的方法,其中,确定合计风险值的步骤包括:合计要与所述候选路径交叉的该组区域段的所述风险参数。5.根据权利要求1所述的方法,其中,确定所述风险值的步骤进一步包括:基于与至少一条先前执行的路径交叉的一组区域段的所述风险参数来确定所述路径规划开发模块的总风险值,其中,与至少一条先前执行的路径交叉的该组区域段与先前获得的与所述至少一条先前执行的路径相同时期的风险图相关联;其中,所述至少一个风险标准包括总风险阈值,并且其中,仅在所述总风险值低于所述
总风险阈值时才执行在输出处生成指示用于所述ads执行所述候选路径的指令的所述第一控制信号的步骤。6.根据权利要求5所述的方法,其中,确定所述总风险值的步骤包括:对与所述至少一条先前执行的路径交叉的该组区域段的所述风险参数求平均值,以便确定所述路径规划开发模块的平均风险暴露,所述平均风险暴露定义所述总风险值。7.根据权利要求6所述的方法,其中,对所述风险参数求平均值的步骤包括:对于每个时间样本:基于自先前时间样本以来与最近执行的候选路径交叉的一组区域段来确定所述路径规划开发模块的当前风险值;通过将所述当前风险值与所述先前时间样本的先前计算的复合风险值求和来确定当前复合风险值;并且通过将所述当前复合风险值除以直到且包括当前时间样本为止使用的样本的总数量来确定平均风险暴露。8.根据权利要求1所述的方法,进一步包括:从所述车辆的生产平台获得备用路径,所述生产平台包括被配置为生成所述备用路径的确认过的路径规划开发模块;并且如果所确定的风险值未能满足所述至少一个风险标准,则所述方法进一步包括:在输出处生成第二控制信号以执行所获得的备用路径;以及将所述路径规划开发模块停用。9.根据权利要求8所述的方法,进一步包括:如果所确定的风险值未能满足所述至少一个风险标准:则在输出处生成第二控制信号,以启用所述车辆的所述生产平台的路径规划器,用于生成要由所述车辆执行的候选路径。10.根据权利要求1所述的方法,进一步包括:将所述路径规划开发模块的所述路径规划模型的一个或多个更新的参数传输到远程实体;从所述远程实体接收所述路径规划开发模块的所述路径规划模型的一组全局更新的参数,其中,该组全局更新的参数基于从包括所述路径规划开发模块的多个车辆获得的信息;并且基于接收的该组全局更新的参数来更新所述路径规划开发模块的所述路径规划模型。11.根据权利要求1所述的方法,其中,每个风险参数指示如果所述车辆要占据相关联的区域段则发生事故事件的概率和违反预定义的安全阈值的概率中的至少一个。12.根据权利要求1所述的方法,其中,所述自由空间区域的位置包括:位于所述车辆的所述周围环境中的外部对象的位置,并且其中,所估计的外部对象的位置包括所述外部对象的所述位置的不确定性、所述外部对象中的任何动态对象的轨迹以及所估计的动态对象的轨迹的不确定性。13.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序被配置为由车载处理系统的一个或多个处理器执行,所述一个或多个程序包括用于执行根据前述权利要求中的任一项所述的方法的指令。
14.一种用于车辆的路径规划开发模块的自动开发的装置,其中,所述车辆配备有自动驾驶系统ads,所述装置包括控制电路,所述控制电路被配置为:从所述路径规划开发模块获得候选路径,其中,所述路径规划开发模块被配置为基于路径规划模型和指示所述车辆的所述周围环境的数据来生成所述候选路径以供所述车辆执行;获得所述车辆的周围环境的风险图,其中,所述风险图基于所述车辆的致动能力和所述周围环境中的自由空间区域的位置而形成,所述致动能力包括所述致动能力的不确定性估计,并且所述自由空间区域的位置包括所估计的自由空间区域的位置的不确定性估计;其中,所述风险图包括被包括在所述车辆的所述周围环境中的多个区域段中的每一个的风险参数;其中,所述风险图进一步具有时间分量,所述时间分量至少在由所述候选路径的预测持续时间定义的持续时间内基于所述自由空间区域的预测时间演变来指示所述区域段的所述风险参数的时间演变;基于要与所述候选路径交叉的所述区域段的所述风险参数来确定所述候选路径的风险值;并且如果所确定的风险值满足至少一个风险标准,则所述控制电路进一步被配置为:在输出处生成指示用于所述ads执行所述候选路径的指令的第一控制信号;获得所执行的候选路径的至少一个质量参数,其中,所述至少一个质量参数指示所述候选路径在所执行的候选路径的质量和/或舒适度方面的性能;基于所获得的至少一个质量参数来确定指示所述路径规划开发模块的性能的成本函数;以及通过被配置为优化所确定的成本函数的优化算法来更新所述路径规划模型的一个或多个参数。15.一种车辆,包括:一组车载传感器,被配置为监控所述车辆的周围环境;自动驾驶系统ads,包括:感知系统,被配置为基于从该组车载传感器中的一个或多个获得的传感器数据来生成感知数据;和生产平台路径规划器;路径规划开发模块,被配置为生成所述候选路径以供所述车辆执行;以及根据权利要求14所述的装置。

技术总结
提供了用于自动驾驶系统的路径规划系统开发的平台。本发明涉及通过使用联合学习、利用生产车辆来为自动驾驶系统(ADS)开发新的路径规划特征的方法(100)和装置(10)。为了实现这一点,在闭环中评估“测试中的”路径规划模块的输出,以便生成成本函数,该成本函数随后用于对路径规划开发模块(210)的路径规划模型进行更新或训练。行更新或训练。行更新或训练。


技术研发人员:芒努斯
受保护的技术使用者:哲晰公司
技术研发日:2022.04.29
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-10410.html

最新回复(0)