用于自动驾驶系统的路径规划系统开发的平台
1.相关申请的交叉引用
2.本专利申请要求2021年4月29日提交的名称为“用于自动驾驶系统的路径规划系统开发的平台”的第21171217号欧洲专利申请的优先权,本专利申请被转让给本专利申请的受让人,并通过引用明确地并入本文。
技术领域
3.本公开涉及用于配备有自动驾驶系统(ads)的车辆的路径规划模块的性能评估和开发的方法和系统。具体地,本发明涉及车辆的路径规划模块的开环评估及其后续更新。
背景技术:4.在过去几年中,与自动驾驶汽车相关的研究和开发活动数量激增,并且正在探索许多不同的方法。越来越多的现代车辆配备了先进驾驶员辅助系统(adas),以提高车辆安全性和更普遍的道路安全性。adas(例如可以由自适应巡航控制、acc、防撞系统、前向碰撞警告等体现)是可以在驾驶时帮助车辆驾驶员的电子系统。当今,研究和开发在与adas和自动驾驶(ad)领域两者相关的许多技术领域内正在进行。在本文中,adas和ad将参考与所有的不同级别的自动化相对应的通用术语自动驾驶系统(ads),如例如由驾驶自动化的sae j3016级别(0-5)定义的不同级别,特别是级别4和级别5。
5.在不远的将来,预计ads解决方案将进入大多数投放市场的新的车辆中。ads可以被解释为各种部件的复杂组合,这些部件可以被限定为由电子和机械而不是人类驾驶员来执行的车辆的感知、决策进行和操作的系统,并且可以被限定为将自动化引入到道路交通中。这包括对车辆、目的地以及对周围环境的获知的处理。虽然自动化系统具有对车辆的控制,但它允许人类操作者将所有或至少部分责任留给系统。ads通常结合各种传感器来感知车辆的周围环境,例如雷达、激光雷达、声纳、相机、导航系统(例如,gps)、里程表和/或惯性测量单元(imu),先进的控制系统可以在这些传感器的基础上解译感官信息(sensory information),以识别适当的导航路径以及障碍物、自由空间区域(free-space areas)和/或相关标志。
6.当前开发ads的大部分努力都围绕着安全地向市场发布第一个系统。然而,一旦实现这一目标,以安全和有效的方式改进系统将是至关重要的,既可以实现成本降低,也可以提高性能。通常,与ads(或“ads特征(feature)”)的安全性开发、测试和验证相关的成本很高,特别是关联与现场测试和了解系统在交通中的行为方式。此外,不管是从数据存储、处理和带宽的角度还是从数据安全/隐私的视角来看,在管理配备ads的车辆产生的大量数据以便开发、测试和验证各种ads特征方面都存在额外的挑战。
7.因此,本领域需要新的解决方案来促进ads的开发、测试和/或验证,以便能够持续提供更安全和性能更高的系统。与往常一样,最好在不对车载系统或平台的尺寸、功耗和成本产生重大影响的情况下进行改进。
技术实现要素:8.因此,本发明的一个目的是提供一种由车载式计算系统执行的用于车辆的路径规划模块的自动开发的方法,一种计算机可读存储介质,一种用于车辆的路径规划模块的自动开发的装置,以及包括这种装置的车辆,它们减轻、缓解或完全消除当前已知解决方案的所有或至少一些缺点。
9.提供用于促进ads的开发、测试和/或验证的解决方案以便能够持续地提供更安全和更高性能的系统也是本发明的一个目的。
10.这些目的通过由用于车辆的路径规划模块的自动开发的车载式计算系统执行的方法、计算机可读存储介质、用于车辆的路径规划模块的自动开发的装置以及一种包括如所附权利要求中所限定的这种装置的车辆来实现。术语示例性在本上下文中被理解为用作实例、示例或图示。
11.根据本发明的第一方面,提供由车载式计算系统执行的用于配备有ads的车辆的路径规划模块的自动开发的方法。该方法包括从路径规划模块获取候选路径。路径规划模块被配置为基于路径规划模型和指示车辆的周围环境的数据来生成车辆的候选路径。该数据例如可以是从车辆的感知系统获取的经过处理的传感器数据。此外,方法包括获取用于评估候选路径的参考框架。参考框架被配置为当候选路径被应用于参考框架中时指示与候选路径相关联的一个或多个风险值。方法进一步包括通过在参考框架中应用候选路径来评估所获取的候选路径,以便基于一个或多个风险值确定成本函数。成本函数指示在参考框架内的路径规划模块的性能。所指示的路径规划模块的性能例如可以是指示所生成的候选路径有多“安全”的度量。该方法进一步包括通过被配置为对所确定的成本函数进行优化的优化算法来更新路径规划模型的一个或多个参数。
12.因此,上述方法提供了一种用于自动驾驶车辆的学习平台,其中量产ads的量产系统和传感器被利用来执行ads的路径规划特征的下一个版本的联合学习。由此,很容易在成本和时间方面为自动驾驶车辆的路径规划特征的开发、测试和验证提供优势。
13.根据本发明的第二方面,提供一种存储一个或多个程序的(非暂时性)计算机可读存储介质,该一个或多个程序被配置为由车载式处理系统的一个或多个处理器执行,一个或多个程序包括用于执行根据本文中公开的任意实施例的方法的指令。对于本发明的该方面,存在与前面讨论的本发明的第一方面类似的优点和优选特征。
14.如本文中所用的术语“非暂时性”旨在描述不包括传播电磁信号的计算机可读存储介质(或“存储器”),但不旨在以其他方式限制物理的计算机可读存储设备(由短语计算机可读介质或存储器涵盖的)的类型。例如,术语“非暂时性计算机可读介质”或“有形存储器”旨在涵盖不一定永久储存信息的存储设备类型,包括例如随机存取存储器(ram)。以非暂时形式储存在有形计算机可访问存储介质上的程序指令和数据可以进一步通过传输介质或信号(例如电、电磁或数字信号)进行传输,其可以通过诸如网络和/或无线链接的通信介质传送。因此,本文中所使用的术语“非暂时性”是对介质本身的限制(即,有形的,不是信号),而不是对数据存储持久性(例如,ram与rom)的限制。
15.此外,根据本发明的第三方面,提供了一种用于配备有ads的车辆的路径规划模块的自动开发的装置。该装置包括被配置为从路径规划模块获取候选路径的控制电路。路径规划模块被配置为基于路径规划模型和指示车辆周围环境的数据来生成车辆的候选路径。
控制电路进一步被配置为获取用于评估候选路径的参考框架。参考框架被配置为当候选路径被应用于参考框架中时指示与候选路径相关联的一个或多个风险值。此外,控制电路被配置为通过在参考框架中应用候选路径来评估所获取的候选路径,以便基于一个或多个风险值确定成本函数。成本函数指示在参考框架内路径规划模块的性能。此外,控制电路被配置为通过被配置为对所确定的成本函数进行优化的优化算法来更新路径规划模型的一个或多个参数。对于本发明的该方面,存在与前面讨论的本发明的第一方面类似的优点和优选特征。
16.更进一步,根据本发明的另一方面,提供了一种车辆,包括被配置为监视车辆的周围环境的车载传感器的结合。车辆进一步包括具有感知系统的自动驾驶系统(ads),该感知系统被配置为基于从车载传感器的集合中的一个或多个获取的传感器数据生成感知数据。此外,车辆包括被配置为生成车辆的候选路径的路径规划模块,以及根据本文中公开的任一实施例的用于路径规划模块的自动开发的装置。对于本发明的该方面,存在与前面讨论的本发明的第一方面类似的优点和优选特征。
17.本发明的进一步的实施例在从属权利要求中定义。应强调的是,当在本说明书中使用时,术语“包括/包含”用于指明所陈述的特征、整体、步骤或部件的存在。不排除存在或添加一个或多个其他特征、整体、步骤、部件或它们的组。
18.本发明的这些和其他特征和优点将在下文中参考下面被描述的实施例进一步阐明。
附图说明
19.本发明实施例的进一步的目的、特征和优点将从以下参考附图的详细描述中变得明显,在附图中:
20.图1是根据本发明实施例的由车载式计算系统执行的用于车辆的路径规划模块的自动开发的方法的示意性流程图表示。
21.图2是根据本发明实施例的风险地图和对风险地图有贡献的不同部件中的一些的示意性俯视图图示。
22.图3是相对于图2中图示的风险地图在随后的时间步长(time step)的风险地图的示意性俯视图图示。
23.图4是根据本发明实施例的具有以网格形式指示的区域段的风险地图的示意性俯视图图示。
24.图5是根据本发明实施例的以描绘车辆接近物体的时间发展的一系列场景为形式的后处理方法的示意性俯视图图示。
25.图6a是根据本发明实施例的基于基准世界视图(baseline worldview)的路径评估过程的示意性俯视图。
26.图6b是根据本发明实施例的基于基准世界视图的路径评估过程的示意性俯视图。
27.图7是根据本发明实施例的用于车辆的路径规划模块的自动开发的系统的示意框图表示。
28.图8是根据本发明实施例的包括用于车辆的路径规划模块的自动开发的装置的车辆的示意性侧视图。
具体实施方式
29.本领域技术人员将理解,本文中解释的步骤、服务和功能可以使用单独的硬件电路实施、使用与编程的微处理器或通用目的计算机相结合的软件实施、使用一个或多个专用集成电路(asic)和/或使用一个或多个数字信号处理器(dsp)实施。还应当理解,当本发明根据一种方法进行描述时,该方法还可以以一个或多个处理器和一个或多个与该一个或多个处理器耦接的存储器体现,其中该一个或多个存储器储存一个或多个程序,该一个或多个程序当由该一个或多个处理器执行时执行本文中公开的步骤、服务和功能。
30.图1是由车载式计算系统执行的用于车辆的路径规划模块的自动开发的方法100的示意性流程图表示。车辆配备了自动驾驶系统(ads),在当前上下文中,ads包括自动化的所有的不同级别,如例如由驾驶自动化的sae j3016级别(0-5)定义的不同级别,并且特别是级别4和级别5。换言之,术语ads涵盖先进驾驶辅助系统(adas)和自动驾驶(ad)。
31.更具体地,方法100涉及车辆的路径规划模块的开环评估及其后续更新。术语“开环”评估也可以被称为“影子模式”或“沙盒模式”,并且可以相应地被理解为在没有所生成的候选路径的驱动(actuation)下对路径规划模块的输出的评估。
32.方法100包括从路径规划模块获取101候选路径。术语“路径规划模块”也可以被称为“被测模块”(module under test,mut)或路径规划开发模块,意指用于汽车应用的路径规划特征的“新的”(开发中的)软件和/或硬件。换言之,路径规划模块在本上下文中可以被理解为被配置为基于感知数据(例如,原始传感器数据或处理后的传感器数据)生成候选路径的软件和/或硬件,其中路径规划模块是当前“开发中的”,尚未“投入量产(production)的”(例如,未认证/验证的)。车辆或更准确地说车辆的ads可以自然地配备有“量产路径规划器”,即作为被配置为生成要由车辆的ads执行的路径的量产平台/系统的一部分的路径规划模块。术语“获取”在本文中被广义地解释并且涵盖接收、取得、收集和获得等。
33.因此,路径规划模块被配置为基于路径规划模型(例如,机器学习算法或人工神经网络等)和指示车辆的周围环境的数据来生成用于车辆的执行的候选路径。因此,指示周围环境的数据(例如,感知数据)作为路径规划模型的输入,并且路径规划模型的输出是一条或多条候选路径。指示车辆的周围环境的数据例如可以是由车辆的感知系统产生的感知输出(例如,融合(fused)的传感器数据)。然而,在一些实施例中,指示车辆的周围环境的数据可以是直接从一个或多个车载传感器获取的传感器数据。此外,路径规划模型还可以利用车辆的驱动能力作为输入。如本领域技术人员容易理解的是,本文中使用的术语“驱动能力”可以包括车辆的制动能力、车辆的加速能力和车辆的转向能力等中的一个或多个。
34.此外,方法100包括获取102用于评估候选路径的参考框架。参考框架被配置为当候选路径应用于参考框架中时指示与候选路径相关联的一个或多个风险值。参考框架可以被理解为在开环测试中对候选路径进行评估的框架。在一些实施例中,参考框架是风险地图的形式,该风险地图基于车辆的驱动能力和周围环境中的自由空间区域的位置形成。参考以下图2至图4更详细地讨论风险地图。然而,在一些实施例中,参考框架是基准世界视图的形式的,该基准世界视图是从量产系统的感知系统的输出的后处理生成的。后处理和基准世界视图将参考以下图5、图6a和图6b更详细地讨论。
35.方法100进一步包括通过在参考框架中应用候选路径来评估103所获取的候选路径,以便基于一个或多个风险值确定110、114成本函数。因此,成本函数指示在参考框架内
路径规划模块的性能。
36.此外,方法100包括通过被配置为对所确定的成本函数进行优化的优化算法(例如,基于梯度的优化器(gradient-based optimizer)或无梯度的优化器(derivative-free optimizer))来更新104路径规划模型的一个或多个参数。在本公开中,术语成本函数、损失函数和误差函数可互换使用。因此,如本文中定义的成本函数的目的是提供一种更新路径规划模型的手段,从而将来自路径规划模型的期望的输出最大化并将不想要的输出最小化。更详细地,成本函数优选地相对于一个或多个预定义目标(即预定义目标值)来设定。例如,被定义的风险值阈值可用于形成成本函数的“目标”。换言之,成本函数的目的是将与候选路径相关联的一个或多个风险值最小化,直到特定的点。这为了便于避免路径规划被优化到是“最安全”的选择的“意识到”的级别是静止不动的潜在情况。然而,人们也可以采用一些固定的约束(例如,车辆必须从a移动到b),以便避免这种情况。
37.等效的解决方案是在评估103步骤中确定110、114对应的“奖励函数”,并且通过被配置为将所确定的“奖励函数”最大化的优化算法来更新104路径规划模型的一个或多个模型参数。
38.ads的路径规划算法的开发、测试和验证通常被认为是一项昂贵且耗时的工作,因为测试需要安全并且需要大量用于验证的努力。这两个阶段(开发和测试)的成本都很高,并且会延长向市场提供新路径规划解决方案的交付时间。然而,本发明人意识到,通过在已经发布的量产车辆之上进行构建可以潜在地减轻许多昂贵的步骤,因为开发、测试和验证的一部分可以在量产车辆中完成,而无需专门的车辆和检测人员。因此,本文中提出的方法和装置提供了一种用于以足够安全的方式执行新路径规划模块的开环开发、测试和/或验证的全自动解决方案。
39.换言之,本发明提供了一种用于自主车辆的学习平台,其中量产ads的量产系统和传感器被利用来执行用于ads的路径规划特征的下一版本的联合学习。从而为自动驾驶车辆的路径规划特征的开发、测试和/或验证在成本和时间方面提供优势。
40.只要看起来开环学习以足够的速率继续改进路径规划模块,本文中提出的开环评估就可以有利地被允许继续迭代。例如,人们可以运行开环评估,直到路径规划模块的性能使得候选路径的大多数(在设定的时间段上)相对于它们在参考框架中被估计的风险可以被允许执行。另外或替代地,可以使用开环评估直到在参考框架中的候选路径的被估计的风险(在设定的时间段上)至少与量产平台的路径规划器相当(或至少在一定的容差范围内)。
41.因此,本文中公开的本发明的一些技术优势是:具有成本效益和时间效率的新路径规划特征的开发、测试和/或验证;可以利用已发布的车辆中的可用的量产资源来进一步开发、测试和/或验证路径规划系统。
42.此外,在联合学习的方案中,多个车辆中的每个车辆的更新104后参数可以有利地合并在中央单元或云单元中,由此可以将“全局更新”推送到整个车辆的队列。因此,在一些实施例中,方法100进一步包括将路径规划模型的一个或多个更新104后参数传输105到远程实体(例如,后台或队列管理系统)。此外,方法100可以包括从远程实体接收106路径规划模块的路径规划模型的全局更新后的参数的集合。相应地,全局更新后的参数的集合基于从包括相应路径规划模块的多个车辆获取的信息。然后,方法100可以包括基于接收到的全
局更新后的参数的集合来更新107路径规划模块的路径规划模型。
43.更进一步地,在一些实施例中,获取102参考框架的步骤包括获取108车辆的周围环境的风险地图。风险地图是基于车辆的驱动能力和周围环境中的自由空间区域的位置形成的。更具体地,驱动能力包括驱动能力的不确定性估计,并且自由空间区域的位置包括被估计的自由空间区域的位置的不确定性估计。
44.风险地图包括在车辆的周围环境中包括的多个区域段中的每个区域段的风险参数。此外,风险地图进一步具有时间分量,该时间分量至少在由候选路径的预测持续时间限定的持续时间内基于自由空间区域的预测的时间演变而指示区域段的风险参数的时间演变。因此,风险地图然后形成参考框架,所获取101的候选路径要针对该参考框架而被评估103。时间分量例如可以取决于在自主车辆的周围环境中的动态对象(例如,外部车辆)的预测轨迹(至少在由候选路径的预测持续时间定义的持续时间内的预测轨迹)。
45.如本领域技术人员容易理解的,风险地图可以例如从风险地图引擎取得或接收,该风险地图引擎被配置为基于风险地图模型给定的一个或多个诸如例如当前速度、车辆特性(车辆尺寸、车辆重量等)和路面特性等的实时变量(该实时变量源自一个或多个车载传感器)来生成风险地图。不确定性估计可以从与每个驱动参数相关联的预定义统计模型导出,其中驱动能力通过平均值或模式值(mode value)给出,并且不确定性估计通过例如高于或低于平均值的一个或两个标准偏差给出。
46.自由空间区域可以例如从一个或多个被配置为监视车辆的周围环境的车载传感器的传感器数据导出。然而,传感器数据也可以源自车辆的附近的其他传感器,例如源自安装在其他车辆或基础设施元件上的传感器并且通过v2v或v2x通信网络获取。
47.在本上下文中,自由空间区域可以被理解为自主车辆的周围环境中没有物体(例如,其他车辆、行人、障碍物、动物、自行车、静态物体等)的区域。因此,所获取的自由空间区域的位置可以被理解为对没有外部物体(静态物体和动态物体)的区域的估计以及对这种确定的不确定性的估计,即,被确定的自由空间区域的位置实际上为真的可能性。
48.此外,在一些实施例中,自由空间区域的位置包括位于自主车辆的周围环境中的外部对象的位置。被估计的外部对象的位置可以包括外部对象的位置的不确定性、被估计的外部对象的任意动态对象的轨迹以及被估计的动态对象的轨迹的不确定性。然而,在一些实施例中,自由空间区域的位置由车辆的专用模块确定,其中该专用模块被配置为获取指示车辆的周围环境的传感器数据,并且基于传感器数据得出自由空间区域相对于车辆的位置。因此,在获取自由空间区域的位置之前,不必存在检测对象的中间步骤或层次,即,可以直接获取“自由空间区域”。例如,激光雷达发射的信号在从一些表面反射之前可以在空间中传播一定距离,那么激光雷达和表面之间的这个区域可以被定义为“自由空间区域”,无需任意操作或步骤来定义信号从其反射的表面。
49.图2和图3是根据本发明的实施例的在两个连续的时间步长处的具有对风险地图40有贡献的一些示例性部件41至46”的风险地图40的两个示意性俯视图图示。此外,在地图40中指示了自主车辆的用于执行的规划的路径47a至47b。更详细地,虚线箭头指示来自先前时间实例/样本的“候选路径”47a,并且当前候选路径47b是由图3中的车辆前方的箭头指示。
50.此外,风险地图40包括指示被估计的车辆41的制动能力43的信息,该信息包括被
估计的制动能力43的不确定性估计43'、43”。此外,风险地图40包括地图中的自主车辆的地理位置41、地理位置41的不确定性估计42、外部对象44、46的位置、外部对象的位置的不确定性44',44”,46'、动态对象44的轨迹45和轨迹45的不确定性45'、45”。被估计的不确定性可以例如基于定义容差的模型(预定义或自学习/机器学习的模型)或从车辆的传感器(例如,相机、雷达、激光雷达、超声波传感器等)提供的测量的误差范围来计算。由此,所形成的风险地图40还考虑了由例如传感器制造公差和噪声等引起的自主车辆的世界视图(worldview)的这种测量中固有的不确定性。因此,整个风险估计被渲染的更加准确和可靠,更加准确地反映了车辆的ads的实际风险暴露。然而,在一些实施例中,如本领域技术人员容易理解,被估计的不确定性固有地由量产平台的感知系统提供,并且随后并入所生成的风险地图40中。
51.图4是根据本发明实施例的包括具有以网格50的形式指示的区域段51的、相对于图3中描绘的风险地图在随后的时间步长/样本的风险地图的示意性俯视图图示。如之前所描述的,为了确定候选路径47的聚合风险值(aggregated risk value),可以求和和/或形成与和规划路径47交叉的区域段52相关联的风险值的平均值。
52.此外,图4的左下角示出了风险地图的示意性顶视图并且用于图示根据本发明的一些实施例可以如何确定总风险值。更详细地,描绘了延伸通过风险地图40的候选路径47,候选路径47进一步具有覆盖的网格框架50,以便举例说明可以如何形成区域段。如之前所描述的,风险地图40具有多个区域段51,每个区域段51与风险参数相关联,该风险参数指示如果路径与相关区域段交叉而发生事故的概率和违反预定义的安全阈值的概率中的至少一个。在每个框51中,风险参数的“值”由框51的图案指示。因此,风险地图40描绘了特定的“高风险”区域段44、“低风险”区域段43以及介于两者之间的值。
53.候选路径47的风险(即,与候选路径相关联的风险值)可以使用风险地图40通过一种或多种方式来评估。例如,当跨风险地图40(即,风险地图上的路径的积分(integral))执行时,可以使用候选路径47的聚合风险。因此,可以聚合与候选路径47交叉的区域段52的风险值,以便导出候选路径47的复合风险或平均风险。在一些实施例中,聚合的风险值随后可用于定义成本函数。
54.回到图1,评估103所获取的候选路径的步骤可以包括基于与候选路径交叉的区域段的集合的风险参数来确定109候选路径的聚合风险值。相应地,聚合的风险值限定一个或多个风险值。此外,评估103所获取的候选路径的步骤可以包括基于所确定109的聚合风险值确定110成本函数。
55.如所提到的,在一些实施例中,参考框架是从量产系统的感知系统的输出的后处理生成的基准世界的形式的。因此,在一些实施例中,获取102参考框架的步骤包括存储111在一时间段期间从车辆的感知系统获取的感知数据的集合。感知系统被配置为基于在该时间段期间从一个或多个车载传感器获取的传感器数据而生成该感知数据的集合。在当前上下文中,感知系统(量产平台/系统的感知系统)被理解为负责从车载传感器(诸如,相机、激光雷达和雷达、超声波传感器)获取原始传感器数据并将该原始数据转换为场景理解的系统。
56.该感知数据的集合可以例如被储存或保存在数据缓冲器(未示出)中,其中该感知数据的集合可以被理解为指示车辆的周围环境的数据。这例如可以是从第一时间点t1到第
二时间点t2、连续和/或间歇地得出的检测到的对象或对象的状态和/或车辆定位,和/或未来状态的统计和物理模型预测。时间段以及相应的可选数据缓冲器的长度可以是任意认为可行的任意大小,例如考虑到数据容量限制和/或ads的特性,并且可以例如从不到一秒到几分钟,或更优选地从几秒到不到一分钟。
57.此外,获取102参考框架的步骤包括通过对感知数据的集合进行后处理来形成112基准世界视图,该基准世界视图指示在一时间段期间车辆的周围环境中的情景。因此,这个基准世界视图形成了参考框架。“场景”可以是在该时间段期间的一个或多个时间点处的包括检测到的对象的位置、对象类别/类型、车道标记的位置、车道标记的延伸、自由空间检测以及/或车辆的周围环境中检测到的物体的轨迹的一个或多个瞬时场景。应注意,该列表仅用于举例说明“场景”中包括的参数,并且可以包括本领域技术人员容易理解的可由车辆的感知模块检测到的其他参数。
58.现在将参考图5进一步举例说明后处理步骤112,图5描绘了向朝向外部物体24的道路部分移动的车辆1的一系列示意性顶视图(a)至(d)。每个图示与从第一时刻t1到第二时刻t2变化的时间段21内的时间点相关联。
59.在第一图示(a)中,车辆1(也可以被称为自主车辆1)正在朝着外部物体移动,这里的外部物体是在道路部分上的邻近车道上在同一方向上行驶的卡车24的形式。然而,由于到卡车24的距离,车辆的感知系统/模块可能无法以足够高的准确度水平确定外部物体的位置并且将其分类为卡车。这由包围卡车24的框22a指示,框22a用于示意性地指示检测和分类的“不确定性”。
60.在随后的时刻,即图5的图示(b),车辆1更靠近外部物体,并且关于外部物体24的位置和类别/类型的不确定性降低,如与第一个框22a相比尺寸减小的框22b所指示的。
61.在另一随后的时刻,即图5的图示(c),车辆1的感知系统/模块能够准确地确定外部对象2的位置并且将其分类为卡车2。更具体地,与当自主车辆1远离卡车时相比,自主车辆1现在足够靠近卡车2从而能够对卡车2进行分类并以更高水平的准确度估计卡车在道路上的位置。
62.然后,通过适当的过滤技术并基于“场景”的时间发展,能够在t1和t2之间的时间的中间点23处建立“基准世界视图”,如在图5的下部图示中(即,在图5的图示(d)中)所指示的。更详细地,过滤可以例如基于轨迹、位置等的时间发展,结合车辆1和外部物体2的预定义的模型(例如,运动模型)。所建立的基准世界视图随后可用作“基本事实”,以用于训练和/或验证从路径规划模块获取的输出。
63.根据一些实施例,形成基准世界视图的步骤包括:基于对从第二时间点返回到在第一时间点t1和第二时间t2之间的中间时间点的感知数据的集合的一部分进行后处理,来确定表示车辆的周围环境的基准世界视图。因此,基准世界视图以感知数据的集合的一部分为条件。此外,根据一些实施例,感知数据的集合的该一部分的后处理包括通过后向过滤器(backwards filter)运行感知数据的集合的该一部分。这里,后向过滤器被配置为基于从中间时间点到第二时点t2的感知参数的集合的状态的发展,在中间时间点处对齐(align)感知数据的集合的感知参数的集合。在本上下文中,感知参数可以是对象检测估计、对象分类估计、对象状态估计、道路参考特征估计、自由空间估计、道路摩擦估计、对象轨迹估计和/或可行驶区域估计。
64.换言之,随着时间从中间时间点23推移第二时间点t2,随着对车辆1周围环境的了解增加并且通过在反向时间方向上分析数据,相比较于在车辆1在“运行时”那样做,可以能够以更高的准确度水平确定在中间时间点处在车辆1的周围环境中的对象的“状态”(即,类别、位置、轨迹等)。因此,后处理可以被理解为对指示车辆的周围环境的数据的一种自动的“事后”分析。更详细地,后处理可以例如包括通过后向过滤器运行感知数据的集合,该后向过滤器被配置为将例如对象当前的状态和预测的未来的状态与未来发生的事情(即,从中间时间点到第二时间点t2)对齐。后处理可以包括除通过后向过滤器运行感知数据的集合以外的进一步的处理步骤。更具体地,后处理可以包括来自各种传感器的数据的融合,以及对融合的信息应用后向和前向过滤。用于此目的的合适过滤器例如可以是粒子过滤器或不同类型的卡尔曼过滤器(例如扩展卡尔曼过滤器)。
65.因此,通过对一系列“中间时间点”执行上述后处理112方法,相比于可能的在“运行时”这样做,可以建立在自主车辆的周围环境中的对象的“状态”的时间演变的更可靠的描述。这种对周围环境的后处理的“描述”相应地构成了基准世界视图,然后可以用来评估所获取的101候选路径。优选地,候选路径的预测持续时间包括在所形成的基准世界视图的“持续时间”内。例如,如果所生成的基准世界视图指示在从t1延伸到t5的时间段期间车辆的周围环境中的场景,则候选路径的持续时间可以是从t2到t4。
66.因此,评估103所获取的101候选路径的步骤可以包括将候选路径与基准世界视图进行比较113以便获取一个或多个风险值。然后,可以基于所获取的一个或多个风险值来确定114成本函数,其中每个风险值指示在时间段的至少一部分期间针对候选路径的碰撞威胁度量的时间演变。
67.在图6a至图6b中提供了基于基准世界视图的候选路径评估的一对说明性示例。在这些示例实施例中,(图6a至图6b),后侵入时间(pet)用于定义碰撞威胁度量。后侵入时间(pet)可以被理解为车辆离开侵入的区域与冲突车辆进入同一区域之间的时间差。换言之,在任意时间点处的pet都可以解释为占据任意在空间中的重叠的两个对象之间的时间间隔(差)。因此,在当前情况下,pet是自主车辆离开外部车辆的路径的时刻与外部车辆到达自主车辆的路径的时刻之间的时间,反之亦然。
68.因此,图6a和6b是配备ads的车辆1的示意性俯视图,车辆1包括根据本发明实施例的用于路径规划模块的自动开发的装置。更具体地,图6a和图6b描绘了两种不同的情况,其中pet用于对由车辆1的路径规划模块生成的多个候选路径61、62进行通过/失败评估。
69.然而,pet可以用作一个因素,以便使用pet确定成本函数,从而使pet最大化直到设定水平,因为可能不期望无限地最大化pet。因此,成本可以定义为max(-pet,-pet
max,value
)或
–
min(pet,pet
max,value
)。
70.当利用基准世界视图作为参考框架时,需要一限定的性能值(即,碰撞威胁度量)来执行评估。在根据前述方法对情况进行后处理之后,相应地计算该性能值。应注意的是,pet只是适用的性能值/碰撞威胁度量的一个示例,并且可以利用其他度量,例如刹车威胁数(btn)和转向威胁数(stn),如本领域技术人员容易地理解的。
71.在第一种情况下,在图6a中描述的,自主车辆1的路径规划模块1(即,被测模块)基于其路径规划模型和指示车辆的周围环境的数据来生成多个候选路径61、62。然后,这些候选路径可以与由量产平台的感知系统生成的感知数据类似地被储存(例如,被储存在适当
长度的数据缓冲器中),该感知数据将用于后处理和基准世界视图的生成。一旦在合适的时间段内形成了基准世界视图,就基于pet阈值τ评估候选路径61、62。如描述“第一”情况的图6a所指示的,候选路径61中的一个未通过评估,而其余路径62通过评估。
72.与在图6a中描述的第一情况相比,在图6b中描述的“第二”情况中,在相邻车道上行驶的外部车辆2a以更高的速度行驶。因此,涉及了到最左边车道的车道改变的候选路径受到影响,这由未通过评估的候选路径61的更多的数量指示。应注意的是,在图6a和图6b中描绘的示例是二元评估(通过/失败)的简化示例,并且可以在评估中使用进一步的参数,以确定每个候选路径的一个或多个风险值。
73.此外,应注意的是,在这两个评估过程(风险地图/后处理)中,都不是车辆的ads实际执行的候选路径。此外,可以基于这两个评估过程的结果的任意组合来构建开环学习的成本函数。因此,在一些实施例中,参考框架实际上是两个参考框架,一个由风险地图定义,并且一个由后处理过程生成的基准世界视图定义。
74.可选地,用于执行这些功能的可执行指令被包括在非暂时性计算机可读存储介质中或者被包括在被配置为由一个或多个处理器执行的其他计算机程序产品中。
75.图7是根据本发明实施例的用于配备有ads的车辆的路径规划模块73的自动开发的装置或系统10的示意框图表示。总体而言,图7描绘了通过暴露于车辆的周围环境中的事件、到路径评估过程以及进一步到“后台”2中的传输和随后整合的信息流。装置/系统10包括被配置为执行本文中公开的方法的功能的各种控制电路,其中这些功能可以包括在非暂时性计算机可读存储介质中或包括在被配置为由控制电路执行的其他计算机程序产品中。图7用于通过描绘各种“模块”来更好地阐明本发明,各种“模块”中的每个都与前述的一个或多个特定功能相关联。
76.应注意的是,在“评估引擎”7中被比较的“候选路径”可以包括多条候选路径。
77.系统10具有路径规划模块73,路径规划模块73被配置为基于路径规划模型和指示车辆的周围环境的数据(诸如,例如由车辆的感知系统78生成的感知数据)来生成车辆的候选路径。因此,感知系统78被配置为在一时间段期间基于从一个或多个车载传感器获取的传感器数据71生成感知输出。传感器数据71可以例如从雷达设备、激光雷达设备、相机和超声波传感器等中的一个或多个输出。换言之,在当前上下文中,“感知系统”(即,量产平台的感知系统)被理解为负责从诸如相机、激光雷达和雷达、超声波传感器的车载传感器获取原始传感器数据并将这些原始数据转换为包括状态估计及其预测的场景理解的系统。
78.车辆的量产平台/系统72被配置为供应用于评估候选路径的参考框架。参考框架被配置为当候选路径应用于参考框架中时指示与候选路径相关联的一个或多个风险值。此外,参考框架可以是由风险地图引擎79生成的风险地图和/或由后处理模块77生成的基准世界视图的形式。
79.因此,在一些实施例中,感知数据被存储或保存在数据缓冲器(未示出)中,其中该感知数据可以被理解为指示车辆的周围环境的数据。这可以例如是从第一时间点t1到第二时间点t2、连续和/或间歇地得出的检测到的对象或对象的状态和/或车辆定位,和/或未来状态的统计和物理模型预测。时间段以及相应的可选数据缓冲器的长度可以是任意认为可行的任意大小,例如考虑到数据容量限制、候选路径的预测持续时间和/或ads的特性,并且可以例如从不到一秒到几分钟,或更优选地从几秒到少于一分钟。
80.此外,量产平台72可以相应地包括后处理模块77,后处理模块77用于形成指示在该时间段期间车辆的周围环境中的情景的基准世界视图。基准世界视图是基于量产ads的感知系统78生成的感知数据形成的。应注意的是,术语“通过后处理形成感知数据的第一集合”并不一定意味着所有被储存的数据都被处理,而应被理解为被储存的感知数据的至少一部分或至少一系列被储存的感知数据被后处理。
81.在一些实施例中,量产平台72具有风险地图引擎79,风险地图引擎79被配置为基于车辆的驱动能力和周围环境中的自由空间区域的位置来生成风险地图。驱动能力包括驱动能力的不确定性估计,并且自由空间区域的位置包括被估计的自由空间区域的位置的不确定性估计。换言之,风险地图引擎79被配置为根据包括来自感知系统72的不确定性和由车辆平台报告的能力和不确定性(例如,转向能力、制动能力等)的检测和预测来编译风险地图。风险地图可以被理解为车辆的周围环境的虚拟地图,具有多个被限定的区域段,每个区域段与对应的风险参数相关联。
82.此外,风险地图进一步具有时间分量,该时间分量至少在由候选路径的预测持续时间限定的持续时间内基于自由空间区域的预测的时间演变而指示区域段的风险参数的时间演变。预测的时间演变可以例如基于感知数据和一个或多个预测模型(例如,轨迹预测、统计模型等)。
83.根据说明性示例,所获取的驱动能力可以包括制动能力和所获取的制动能力的不确定性估计或一种“误差范围”。例如,如果所获取的制动能力指示车辆能够在150米的距离内变为完全停止(假设紧急制动驱动),则该估计的不确定性估计可以包括
±
15米(即,
±
10%)的误差范围。如前所述,驱动能力可以从一个或多个驱动参数的统计模型中给出,其中每个驱动参数的不确定性估计可以由那些统计模型中的标准偏差来定义。
84.此外,风险地图引擎79获取车辆的周围环境中的自由空间区域的位置(例如,从车辆的感知系统78获取),其中所获取的自由空间区域的位置包括被估计的自由空间区域的位置的不确定性估计。如之前所述的,在本上下文中,自由空间区域可以被理解为自主车辆的周围环境中没有物体(例如,其他车辆、行人、障碍物、动物、自行车、静态物体等)的区域。因此,所获取的自由空间区域的位置可以包括被确定的外部对象(静态对象和动态对象)的位置、被确定动态对象的轨迹以及确定的不确定性的估计,即,被确定的自由空间区域的位置实际上为真的可能性。
85.此外,参考框架被供应到评估引擎74,评估引擎74被配置为通过在参考框架中应用候选路径来评估所获取的候选路径,以便基于一个或多个风险值来确定成本函数。成本函数的输出相应地指示参考框架内的路径规划模块的性能,或者更具体地,指示与候选路径相关联的风险水平。因此,在一些实施例中,成本函数指示所生成的候选路径是否可以被认为是安全的(在给定一个或多个预定义标准的情况下是安全的)。
86.例如,评估引擎74可以被配置为通过基于与候选路径交叉的区域段的集合的风险参数确定候选路径的聚合风险值,来评估候选路径,其中聚合风险值定义了一个或更多与候选路径相关的风险值。因此,评估引擎74可以被配置为基于所确定的聚合风险值来确定成本函数。
87.替代地或附加地,评估引擎74可以被配置为通过将候选路径与基准世界视图进行比较并且基于一个或多个风险值确定成本函数,来评估候选路径。每个风险值相应地指示
在时间段的至少一部分期间候选路径的碰撞威胁度量的时间演变。
88.此外,系统10具有学习引擎75,学习引擎75被配置为通过被配置为对所确定的成本函数进行优化的优化算法来更新路径规划模型的一个或多个参数。此外,学习引擎75可以被配置为将路径规划模块的路径规划模型的一个或多个更新后的参数传输到远程实体2,然后从远程实体接收路径规划模块的路径规划模型的全局更新后的参数的集合。该全局更新后的参数的集合基于从包括对应路径规划模块的多个车辆获取的信息。此后,学习引擎75可以基于接收到的全局更新后的参数的集合来更新路径规划模块的路径规划模型。因此可以解释为跨整个车辆的队列的“整合”过程。
89.图8是根据本发明实施例的车辆1的示意性侧视图图示,车辆1包括用于配备有ads的车辆的路径规划模块的自动开发的装置10。车辆1进一步包括感知模块/系统6(即,量产平台的感知系统)和定位系统5。定位系统5被配置为监视车辆的地理位置和前进方向,并且可以为全球导航卫星系统(gnss),例如gps。然而,定位系统可以被替代地实现为实时动态(rtk)gps,以便提高准确性。
90.更详细地,感知模块/系统6可以指任意公知的系统和/或功能,例如包括在车辆1中的一个或多个电子控制模块和/或节点中,适于和/或被配置为解译与车辆1的驾驶相关的感官信息,以识别例如障碍物、车道、相关标志、适当的导航路径等。因此,结合感官信息,示例性感知系统6可以适于依赖并获取来自多个数据源(例如汽车成像、图像处理、计算机视觉和/或车辆中的网络等)的输入。这种示例性感官信息可以例如从一个或多个可选的、包括在车辆1中和/或以车辆1车载的方式提供的周围检测传感器6a至6c导出。周围检测传感器6a至6c可以由适于感测和/或感知车辆1的周围环境和/或行踪的任意传感器表示,并且可以例如指雷达、激光雷达、声纳、相机、导航系统(例如,gps)、里程计和/或惯性测量单元中的一种或者一种或多种的组合。
91.装置10包括一个或多个处理器11、存储器12、传感器接口13和通信接口14。处理器11也可以被称为控制线路11或控制电路11。控制电路11被配置为执行储存在存储器12中的指令,以执行根据本文中公开的实施例中的任一实施例的用于车辆1的路径规划模块的自动开发的方法。换言之,装置10的存储器12可以包括用于存储计算机可执行指令的一个或多个(非暂时性)计算机可读存储介质,当由一个或多个计算机处理器11执行时,该指令例如可以导致计算机处理器11执行本文中描述的技术。存储器12可选地包括高速随机存取存储器,诸如dram、sram、ddr ram或其他随机存取固态存储器设备;并且可选地包括非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备或其他非易失性固态存储设备。
92.控制电路11被配置为从路径规划模块获取候选路径。路径规划模块被配置为基于路径规划模型和指示车辆的周围环境的数据来生成车辆的候选路径。控制电路11进一步被配置为获取用于评估候选路径的参考框架。参考框架被配置为当候选路径被应用于参考框架中时指示与候选路径相关联的一个或多个风险值。此外,控制电路11被配置为通过在参考框架中应用候选路径来评估所获取的候选路径,以便基于一个或多个风险值确定成本函数。成本函数指示在参考框架内路径规划模块的性能。此外,控制电路11被配置为通过被配置为对所确定的成本函数进行优化的优化算法来更新路径规划模型的一个或多个参数。
93.此外,车辆1可以通过例如无线链路连接到外部网络20(例如,用于取得地图数
据)。相同的或一些其他的无线链路可以用于与在车辆的附近中的其他车辆2通信或与本地基础设施元件通信。蜂窝通信技术可以用于远程通信,例如与外部网络的通信,并且如果所使用的蜂窝通信技术具有低延迟,则它也可用于车辆之间、车辆到车辆(v2v)和/或车辆到基础设施、v2x之间的通信。蜂窝无线电技术的示例包括gsm、gprs、edge、lte、5g和5g nr等,还包括未来的蜂窝解决方案。然而,在一些解决方案中使用中短程通信技术,诸如无线局域网(lan),例如基于ieee 802.11的解决方案。etsi正在制定用于车辆通信的蜂窝标准,例如,由于低延迟和高带宽和通信通道的高效处理,5g被认为是一种合适的解决方案。
94.以上已经参考具体实施例体现了本发明。然而,除上述之外的其他实施例是可能的并且在本发明的范围内。在本发明的范围内可以提供与上述方法步骤不同的方法步骤,通过硬件或软件执行该方法。因此,根据示例性实施例,提供了一种非暂时性计算机可读存储介质,存储被配置为由车辆控制系统的一个或多个处理器执行的一个或多个程序,该一个或多个程序包括用于执行根据上述实施例中的任一实施例的方法的指令。可替代地,根据另一个示例性实施例,云计算系统可以被配置为执行本文中提出的任意方法。云计算系统可以包括分布式云计算资源,分布式云计算资源在一个或多个计算机程序产品的控制下共同执行本文中提出的方法。
95.一般而言,计算机可访问介质可包括任意有形或非暂时性储存介质或存储介质,例如电介质、磁介质或光介质,例如,通过总线耦接到计算机系统的磁盘或cd/dvd-rom。如本文中所用,术语“有形”和“非暂时性”旨在描述不包括传播电磁信号的计算机可读存储介质(或“存储器”),但不旨在以其他方式限制物理的计算机可读存储设备(由短语计算机可读介质或存储器涵盖的)的类型。例如,术语“非暂时性计算机可读介质”或“有形存储器”旨在涵盖不一定永久储存信息的存储设备类型,包括例如随机存取存储器(ram)。以非暂时形式储存在有形计算机可访问存储介质上的程序指令和数据可以进一步通过传输介质或信号(例如电、电磁或数字信号)进行传输,其可以通过诸如网络和/或无线链接的通信介质传送。
96.处理器11(与装置10相关联的处理器11)可以是或包括用于处理数据或信号处理或用于执行储存在存储器12中的计算机代码的任意数量的硬件部件。装置10具有相关联的存储器12,并且存储器12可以是一个或多个用于存储用于完成或促进本说明书中描述的各种方法的数据和/或计算机代码的设备。存储器可以包括易失性存储器或非易失性存储器。存储器12可以包括用于支持本描述的各种活动的数据库部件、目标代码部件、脚本部件或任意其他类型的信息结构。根据示例性实施例,任意分布式存储设备或本地存储设备都可以与本描述的系统和方法一起使用。根据示例性实施例,存储器12通信地连接到处理器11(例如,经由电路或任意其他有线、无线或网络连接而连接到处理器11)并且包括用于执行本文中描述的一个或多个过程的计算机代码。
97.应理解,传感器接口13还可以提供直接获取传感器数据或者通过车辆中的专用传感器控制电路6获取传感器数据的可能性。通信/天线接口14可以进一步提供通过天线8将输出发送到远程位置(例如,远程操作者或控制中心)的可能性。此外,车辆中的一些传感器可以使用本地网络设置(诸如,can总线、i2c、以太网和光纤等)与系统10通信。通信接口14可以被布置为与车辆的其他控制功能通信,并且因此也可以被视为控制接口;然而,可以提供单独的控制接口(未示出)。车辆内的本地通信也可以是具有诸如wifi、lora、zigbee、蓝
牙或类似的中/短程技术的协议的无线类型。
98.因此,应理解,所描述的解决方案的一部分可以在车辆中、在位于车辆外部的系统中或者在车辆内部和外部的组合中实施;例如在与车辆通信的服务器中,即所谓的云解决方案。例如,可以将数据发送到外部系统,并且该系统执行评估候选路径的步骤。实施例的不同特征和步骤可以以不同于所描述的那些组合的方式组合。
99.应注意,词语“包括”不排除存在除所列出的那些之外的其他元件或步骤,并且在元件之前的词语“一”不排除多个这样的元件的存在。还应注意,任意附图标记不限制权利要求的范围,本发明可以至少部分地通过硬件和软件的方式来实现,并且多个“装置”或“单元”可以被硬件的同一项目表示。
100.尽管附图可能示出了方法步骤的特定顺序,但是步骤的顺序可能与所描绘的不同。此外,可以同时或部分同时执行两个或更多个步骤。例如,获取候选路径和获取参考框架的步骤可以根据特定实现互换。这种变化将取决于所选的软件和硬件系统以及设计师的选择。所有这些变化都在本发明的范围内。同样,软件实现可以用标准编程技术和基于规则的逻辑和其他逻辑来完成,以完成各种连接步骤、处理步骤、比较步骤和决策步骤。以上提及和描述的实施例仅作为示例给出,并且不应限制本发明。在所附专利实施例中要求保护的本发明范围内的其他解决方案、用途、目的和功能对于本领域技术人员来说应是显而易见的。
技术特征:1.一种由车载式计算系统执行的用于车辆的路径规划模块的自动开发的方法(100),其中所述车辆配备有自动驾驶系统ads,所述方法包括:从所述路径规划模块获取(101)候选路径,其中所述路径规划模块被配置为基于路径规划模型和指示所述车辆的周围环境的数据来生成所述车辆的所述候选路径;获取(102)用于评估所述候选路径的参考框架,所述参考框架被配置为当所述候选路径被应用于所述参考框架中时指示与所述候选路径相关联的一个或多个风险值;通过在所述参考框架中应用所述候选路径来评估(103)所获取的候选路径,以便基于所述一个或多个风险值确定成本函数,所述成本函数指示在所述参考框架内的所述路径规划模块的性能;并且通过被配置为对所确定的成本函数进行优化的优化算法来更新(104)所述路径规划模型的一个或多个参数。2.根据权利要求1所述的方法(100),其中,获取参考框架的步骤包括:获取(108)所述车辆(1)的周围环境的风险地图(40),其中所述风险地图是基于所述车辆的驱动能力和所述周围环境中的自由空间区域的位置形成的,所述驱动能力包括所述驱动能力的不确定性估计,并且所述自由空间区域的位置包括被估计的所述自由空间区域的位置的不确定性估计;其中,所述风险地图包括在所述车辆的所述周围环境中包括的多个区域段(51)中的每个的风险参数;其中,所述风险地图进一步具有时间分量,所述时间分量至少在由所述候选路径的预测持续时间限定的持续时间内基于所述自由空间区域的预测的时间演变而指示所述区域段的所述风险参数的时间演变;并且其中,所述风险地图形成所述参考框架。3.根据权利要求2所述的方法(100),其中,评估所获取的候选路径的步骤包括:基于与所述候选路径交叉的区域段的集合的所述风险参数,确定(109)所述候选路径的聚合风险值,所述聚合风险值限定所述一个或多个风险值;并且基于所确定的聚合风险值确定(110)所述成本函数。4.根据前述权利要求中的任一项所述的方法(100),其中,获取参考框架的步骤包括:存储(111)在一时间段期间从所述车辆的感知系统获取的感知数据的集合,所述感知系统被配置为基于在所述时间段期间从一个或多个车载传感器获取的传感器数据生成所述感知数据的集合;通过后处理所述感知数据的集合来形成(112)基准世界视图,所述基准世界视图指示在所述时间段期间在所述车辆的所述周围环境中的情景;并且其中,所述基准世界视图形成所述参考框架。5.根据权利要求4所述的方法(100),其中,评估所获取的候选路径的步骤包括:比较(113)所述候选路径与所述基准世界视图,以便获取所述一个或多个风险值;并且基于所获取的所述一个或多个风险值确定(114)所述成本函数,每个风险值指示在所述时间段的至少一部分期间的所述候选路径的碰撞威胁度量的时间演变。6.根据权利要求1所述的方法(100),进一步包括:将所述路径规划模块的所述路径规划模型的一个或多个更新后的参数传输(105)到远
程实体;从所述远程实体接收(106)所述路径规划模块的所述路径规划模型的全局更新后的参数的集合,其中所述全局更新后的参数的集合基于从包括相应路径规划模块的多个车辆获取的信息;并且基于接收到的所述全局更新后的参数的集合,更新(107)所述路径规划模块的所述路径规划模型。7.一种计算机可读存储介质,存储被配置为由车载式处理系统的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行根据前述权利要求中的任一项所述的方法的指令。8.一种用于车辆(1)的路径规划模块(73)的自动开发的装置(10),其中所述车辆配备有自动驾驶系统ads,所述装置包括控制电路(11),所述控制电路(11)被配置为:从所述路径规划模块(73)获取候选路径,其中所述路径规划模块被配置为基于路径规划模型和指示所述车辆的周围环境的数据来生成所述车辆的所述候选路径;获取用于评估所述候选路径的参考框架,所述参考框架被配置为当所述候选路径被应用于所述参考框架中时指示与所述候选路径相关联的一个或多个风险值;通过在所述参考框架中应用所述候选路径来评估所获取的候选路径,以便基于所述一个或多个风险值确定成本函数,所述成本函数指示在所述参考框架内的所述路径规划模块(73)的性能;并且通过被配置为对所确定的成本函数进行优化的优化算法来更新所述路径规划模型的一个或多个参数。9.根据权利要求8所述的装置(10),其中,所述控制电路(11)被配置为通过以下步骤获取参考框架:获取所述车辆(1)的周围环境的风险地图(40),其中所述风险地图是基于所述车辆的驱动能力和所述周围环境中的自由空间区域的位置形成的,所述驱动能力包括所述驱动能力的不确定性估计,并且所述自由空间区域的位置包括被估计的所述自由空间区域的位置的不确定性估计;其中,所述风险地图(40)包括在所述车辆的所述周围环境中包括的多个区域段(51)中的每个的风险参数;其中,所述风险地图进一步具有时间分量,所述时间分量至少在由所述候选路径的预测持续时间限定的持续时间内基于所述自由空间区域的预测时间演变而指示所述区域段的所述风险参数的时间演变;并且其中,所述风险地图形成所述参考框架。10.根据权利要求9所述的装置(10),其中,所述控制电路(11)被配置为通过以下步骤评估所获取的候选路径:基于与所述候选路径交叉的区域段的集合的所述风险参数,确定候所述选路径的聚合风险值,所述聚合风险值限定所述一个或多个风险值;并且基于所确定的聚合风险值确定所述成本函数。11.根据权利要求8至10中的任一项所述的装置(10),其中,所述控制电路被配置为通过以下步骤获取参考框架:
存储在一时间段期间从所述车辆的感知系统获取的感知数据的集合,所述感知系统被配置为基于在所述时间段期间从一个或多个车载传感器获取的传感器数据生成所述感知数据的集合;通过后处理所述感知数据的集合来形成基准世界视图,所述基准世界视图指示在所述时间段期间在所述车辆的所述周围环境中的情景;并且其中,所述基准世界视图形成所述参考框架。12.根据权利要求11所述的装置(10),其中,所述控制电路(11)被配置为通过以下步骤评估所获取的候选路径:比较所述候选路径与所述基准世界视图;并且基于所述一个或多个风险值确定所述成本函数,每个风险值指示在所述时间段的至少一部分期间的所述候选路径的碰撞威胁度量的时间演变。13.根据权利要求8所述的装置(10),其中,所述控制电路(11)进一步被配置为:将所述路径规划模块的所述路径规划模型的一个或多个更新后的参数传输到远程实体(2);从所述远程实体(2)接收所述路径规划模块的所述路径规划模型的全局更新后的参数的集合,其中所述全局更新后的参数的集合基于从包括相应路径规划模块的多个车辆获取的信息;并且基于接收到的所述全局更新后的参数的集合,更新所述路径规划模块的所述路径规划模型。14.一种车辆(1),包括:车载传感器(6a、6b、6c)的集合,被配置为监视所述车辆的周围环境;自动驾驶系统ads,所述自动驾驶系统ads具有被配置为基于从所述车载传感器的集合中的一个或多个获取的传感器数据生成感知数据的感知系统(6、78);路径规划模块(73),被配置为生成所述车辆的候选路径;以及根据权利要求8至13中的任一项所述的装置(10)。
技术总结本发明涉及用于自动驾驶系统的路径规划系统开发的平台。本发明提供了一种方法(100)和装置(10),该方法(100)和装置(10)利用量产车辆通过使用联合学习为自动驾驶系统(ADS)开发新的路径规划特征。为了实现这一点,“被测”路径规划模块的输出在开环中被评估,以便产生成本函数,该成本函数随后用于更新或训练路径规划模块(73)的路径规划模型。规划模块(73)的路径规划模型。规划模块(73)的路径规划模型。
技术研发人员:芒努斯
受保护的技术使用者:哲晰公司
技术研发日:2022.04.29
技术公布日:2022/11/1