基于transformer的多任务交通流预测方法、装置、终端及存储介质
技术领域
1.本发明涉及交通预测技术领域,尤其涉及的是一种基于transformer的多任务交通流预测方法、装置、终端及存储介质。
背景技术:2.交通流量和速度的预测在城市交通管理中具有重要的作用。准确的交通流量和速度预测可以帮助交通部门进行交通管理,为市民出行提供高效的路径规划和导航,是智能交通系统中不可或缺的组成部分。
3.目前,人们在对交通流量及交通速度进行预测时,通常采用机器学习模型分别处理这两个任务,然后再把这些学习结果组合起来。但是上述做法忽略了交通流量及交通速度之间的高度相关性,进而影响对交通流量及交通速度的预测结果的精度,同时也降低了交通管理的效率。
4.因此,现有技术有待改进和提高。
技术实现要素:5.本发明的主要目的在于提供一种基于transformer的多任务交通流预测方法、装置、智能终端及存储介质,能够基于交通流量及交通速度之间的相关性,对两个预测任务分别进行特征增强,提高预测结果的精度。
6.为了实现上述目的,本发明第一方面提供一种基于transformer的多任务交通流预测方法,所述方法包括:
7.将历史交通数据输入编码器进行特征提取,获得历史时空特征;
8.将实时交通流量数据和实时交通速度数据各输入一个解码器并将所述历史时空特征分别输入至所述解码器中;
9.在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;
10.将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;
11.基于所述互补后节点特征,获得交通流量预测结果和交通速度预测结果。
12.可选的,所述从解码器中抽取第二空间特征,包括:
13.基于所述实时交通流量数据和所述实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;
14.获得解码器的解码层输出的时间特征;
15.基于所述相关系数矩阵和所述时间特征,根据图卷积神经网络获得所述第二空间特征。
16.可选的,所述解码器的解码层中串接设有至少两层时间趋势感知自注意力层,最
后的所述时间趋势感知自注意力层的输出结果为所述时间特征。
17.可选的,所述时间趋势感知自注意力层的表达式为:
18.selftrattention(q,k,v)=softmax(conv(q)
×
conv(k))
⊙
v,
19.其中,conv表示的是在时间维度上的1x1的卷积,q为查询向量,k为键值向量,v为值向量。
20.可选的,所述将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征,包括:
21.基于所述实时交通流量数据和所述实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;
22.基于所述相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得所述节点特征;
23.融合所述互补后空间特征与所述节点特征,获得所述互补后节点特征。
24.可选的,所述基于所述相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得所述节点特征,包括:
25.对所述相关系数矩阵采用基于1x1卷积核的卷积操作,获得第一卷积结果;
26.对所述另一个解码器的互补后空间特征采用基于1x1卷积核的卷积操作,获得第二卷积结果;
27.将所述第一卷积结果与所述第二卷积结果进行向量相乘,获得所述节点特征。
28.可选的,所述将历史交通数据输入编码器进行特征提取,获得历史时空特征,包括:
29.基于时间趋势感知自注意力层,提取时间特征;
30.基于空间动态图卷积网络层,提取空间特征;
31.基于所述时间特征和所述空间特征,获得所述历史时空特征。
32.本发明第二方面提供一种多任务交通流预测装置,其中,上述装置包括:
33.历史时空特征提取模块,用于将历史交通数据输入编码器进行特征提取,获得历史时空特征;
34.数据输入模块,用于将实时交通流量数据和实时交通速度数据各输入一个解码器并将所述历史时空特征分别输入至所述解码器中;
35.空间特征模块,用于在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;
36.节点特征模块,用于将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;
37.输出模块,用于基于所述互补后节点特征,获得交通流量预测结果和交通速度预测结果。
38.本发明第三方面提供一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的基于transformer的多任务交通流预测程序,上述基于transformer的多任务交通流预测程序被上述处理器执行时实现任意一项上述基于transformer的多任务交通流预测方法的步骤。
39.本发明第四方面提供一种计算机可读存储介质,上述计算机可读存储介质上存储有基于transformer的多任务交通流预测程序,上述基于transformer的多任务交通流预测程序被处理器执行时实现任意一项上述基于transformer的多任务交通流预测方法的步骤。
40.由上可见,与现有技术相比,本发明方案通过设置一个编码器和两个解码器,使用两个编码器分别处理交通流量任务和交通速度任务,使用编码器提取历史交通数据的历史时空特征并输入至每个解码器中,以增强各个解码器中输入的实时交通数据的特征;而且每个解码器还从另一个解码器中层次性抽取空间特征和节点特征以与自身特征融合和互补,从而通过一个预测任务来增强另一个预测任务的特征,实现特征上相互促进,提高预测结果的精度。
附图说明
41.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
42.图1是本发明的基于transformer的多任务交通流预测方法的模型框图;
43.图2是本发明实施例提供的基于transformer的多任务交通流预测方法流程示意图;
44.图3是图1实施例的步骤s300中抽取第二空间特征具体流程示意图;
45.图4是图1实施例的步骤s400具体流程示意图;
46.图5是图1实施例的步骤s100具体流程示意图;
47.图6是本发明实施例提供的基于transformer的多任务交通流预测装置的结构示意图;
48.图7是本发明实施例提供的一种智能终端的内部结构原理框图。
具体实施方式
49.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
50.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
51.还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
52.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
53.如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当
…
时”或“一旦”或“响应于确定”或“响应于检测到”。类似的,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述的条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0054]
下面结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0055]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0056]
交通流量预测和交通速度预测是智能交通领域和智慧城市领域重要的研究方向,在近年来受到了越来越多的关注。准确和快速的交通流量预测和交通速度预测,对高效的交通管理和路径规划规划具有很大的帮助。
[0057]
而现有采用的将交通流量预测与交通速度预测作为不同预测任务进行分别处理的方法,由于没有考虑交通流量和交通速度之间的相关性,导致预测结果的精度不高,并不能提高交通管理的效率。
[0058]
本发明针对交通流量和交通速度的预测提出一种新的预测算法,具体包括使用一个共享的编码器提取历史交通数据中的时空特征,使用两个独立的解码器分别对交通流量和交通速度进行预测。并且在两个解码器之间设计了一个层次性的特征抽取模块,从一个预测任务中抽取节点级别和空间级别的特征来增强另一个预测任务的特征,从而达到提升另一个预测任务的效果。使得两个预测任务在特征上相互促进,共同提升预测精度。
[0059]
示例性方法
[0060]
本发明实施例提供一种基于transformer的多任务交通流预测方法,如图1所示,使用一个共享的transformer编码器和两个独立的transformer解码器,编码器用于提取历史交通数据中的时空特征,解码器用于分别对交通流量和交通速度进行预测。在时间关系和时间特征方面,编码器和解码器中均采用了时间趋势感知自注意力机制(temporal trend-aware self-attention)模块进行时间特征的抽取。在空间关系和空间特征方面,采用了空间动态图卷积网络(spatial dynamic graph convolution network)模块进行空间特征的抽取。这些模块进行堆叠构成了编码器和解码器提取交通数据时空特征的基础结构。
[0061]
具体地,如图2所示,上述预测方法包括如下步骤:
[0062]
步骤s100:将历史交通数据输入编码器进行特征提取,获得历史时空特征;
[0063]
具体地,交通数据为连续时刻的采样数据,以前面t个连续时刻的交通数据作为历史交通数据,t时刻以后的交通数据为实时交通数据。历史交通数据包括历史交通流量数据和历史交通速度数据。将历史交通数据先进行归一化处理,再经过输入映射层进行映射提取特征以及时间位置嵌入(temporal position embed)和空间位置嵌入(spatial position embed)后输入编码器,编码器中包括多个编码器层,在编码器层中进行时空特征的提取,获得编码器输出的历史时空特征。由于使用一个共享的编码器,能够使得输入的历
史交通数据的特征进行充分的交互。
[0064]
本实施例中,表示为路网节点的历史交通数据,其中t是历史时间步的个数。假设节点的数据采样间隔是5分钟一次,那么时间步的间隔也是5分钟。一个小时具有12个时间步。n是路网上节点的个数。c是输入信号的通道个数。本发明中c=2,即交通流量和交通速度两个通道。首先输入映射层对输入的历史交通数据进行映射提取特征d
model
为神经网络框架模型的维数。由于在交通数据中时间特征和空间特征具有重要的作用,因此还通过时间位置嵌入和空间位置嵌入使得模型获取到时间特征和空间特征。
[0065]
时间位置嵌入采用的方法如下:
[0066][0067][0068]
其中,t是输入数据的位置,d是向量的第d个维度。d
model
是神经网络框架模型的维数。
[0069]
对于空间位置嵌入,使用了对先进行初始化,然后进行拉普拉斯平滑的方式得到每个节点的空间位置嵌入。
[0070]
步骤s200:将实时交通流量数据和实时交通速度数据各输入一个解码器并将历史时空特征分别输入至解码器中;
[0071]
具体地,首先将实时交通流量数据和实时交通速度数据先进行归一化处理,再经过输入映射层进行映射提取特征以及时间位置嵌入(temporal position embed)和空间位置嵌入(spatial position embed)后各输入至一个解码器。
[0072]
本实施例中,解码器包括串接的两个时间趋势感知自注意力层,将历史时空特征输入至第二个时间趋势感知自注意力层,使得解码器能更好地利用历史时空特征进行特征增强。
[0073]
将编码器输出的历史时空特征输入到解码器中,解码器就可以根据历史数据的特征和实时交通流数据进行下一个时间点的交通流量和速度预测。
[0074]
步骤s300:在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;
[0075]
步骤s400:将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;
[0076]
具体地,由于交通流量预测任务和交通速度预测任务之间存在相关性,为了在一个预测任务中学习到另一个预测任务的信息表征,本发明首先将每个解码器提取的空间特征与从另一个解码器抽取的空间特征进行融合,对提取到的空间特征实现互补和增强的效果。然后将每个解码器中的互补后空间特征,与从另一个解码器的互补后空间特征抽取的节点特征进行融合,获得解码器的输出结果,即互补后节点特征。其中,抽取空间特征可以如本实施例在解码器中设置空间动态图卷积网络(spatial dynamic graph convolution network)层,通过使用空间动态图卷积网络模块来提取空间特征,表示为gcn(.);从解码器中抽取节点特征可以对解码器中的互补后空间特征进行卷积操作获得节点特征,表示为
conv(.)。
[0077]
本实施例中,在两个独立的编码器之间设计了一个包含了节点级别和空间级别的特征抽取模块。该特征抽取模块从一个预测任务中抽取节点特征和空间特征来增强另一个预测任务的特征,从而达到提升另一个预测任务的效果。两个预测任务在特征上相互促进,提升模型的整体预测效果。
[0078]
步骤s500:基于互补后节点特征,获得交通流量预测结果和交通速度预测结果。
[0079]
具体地,获得解码器输出的互补后节点特征后,输入一个线性层,获得交通流量预测结果和交通速度预测结果。
[0080]
由上所述,本发明通过使用一个编码器提取历史交通数据中的时空特征,将历史时空特征输入至分别预测交通流量和交通速度的两个解码器中,并在两个解码器之间构建了层次性的特征抽取模块。通过在一个解码器中抽取节点和空间级别的特征来增强另一个解码器的特征,使得两个编码器能够共同提升特征抽取效果,从而准确快速地预测交通流量和交通速度。
[0081]
在一个实施例中,如图3所示,上述步骤s300中从解码器中抽取第二空间特征,具体包括如下步骤:
[0082]
步骤s310:基于实时交通流量数据和实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;
[0083]
具体地,为了增强特征互补的效果,本实施例引入了肯德尔秩相关系数(kendall rank correlation coefficient,krcc),肯德尔秩相关系数用来衡量两个变量之间顺序相关的关系。根据输入的实时交通流量数据和实时交通速度数据计算对应的krcc,获得相关系数矩阵。使用肯德尔秩相关系数表示交通流量和交通速度之间的相关关系,在肯德尔秩相关系数指导下抽取互补特征能够更加有效。
[0084]
其中,肯德尔秩相关系数计算表达式如下:
[0085][0086]
其中,sgn(
·
)是符号函数,(xi,yi),(xj,yj)为两个变量。
[0087]
需要说明的是,该表达式用于计算一个节点上的相关系数,对于交通预测任务的n个节点,需要分别计算每个节点,从而构建出一个相关系数矩阵来表示整个交通节点的相关系数p∈rn×1。
[0088]
步骤s320:获得解码器的解码层输出的时间特征;
[0089]
具体地,解码器中包括多个解码层,在处理交通流数据时,上述解码层中包括用于提取时间特征的解码层。如图1所示,本实施例中的解码器中串接设有两层时间趋势感知自注意力层用于对时间上的特征进行提取,即学习不同时间步之间的时间依赖关系,最后的时间趋势感知自注意力层的输出结果作为时间特征。当然,时间趋势感知自注意力层的个数不限,可以为一个或大于两个。
[0090]
本实施例中还对时间趋势感知自注意力层对所采用的自注意力机制进行了改进,采用了在时间维度上的1x1的卷积层操作,具体表达式为:
[0091]
selftrattention(q,k,v)=softmax(conv(q)
×
conv(k))
⊙
v,
[0092]
其中,conv表示的是在时间维度上的1x1的卷积,q为查询向量,k为键值向量,v为
值向量。
[0093]
由于采用了该卷积,使得计算注意力的时候,考虑了时间上的上下文,使得模型对时间序列上的趋势具有一定的感知。
[0094]
步骤s330:基于相关系数矩阵和时间特征,根据图卷积神经网络获得第二空间特征。
[0095]
具体地,将相关系数矩阵和时间特征进行矩阵相乘,再根据图卷积神经网络获得第二空间特征。
[0096]
本实施例中,两个解码器分别对应着交通流量和交通速度的特征提取,其中包含着对交通流量和交通速度空间关系的提取和建模。解码器提取自身的空间特征时,对最后的时间趋势感知自注意力层输出的时间特征根据图卷积神经网络进行特征提取,获得第一空间特征;由于考虑了肯德尔秩相关系数,在从解码器中抽取第二空间特征时,需要将时间趋势感知自注意力层输出的时间特征与相关系数矩阵进行矩阵相乘,然后再根据图卷积神经网络进行特征提取,获得第二空间特征。
[0097]
其中,对于交通流量预测任务,具体计算方式如下:
[0098][0099]
其中,s
speed
是交通速度预测任务中时间趋势感知自注意力层输出的时间特征,s
flow
为交通流量预测任务中时间趋势感知自注意力层输出的时间特征,gcn是图卷积神经网络,p为相关系数矩阵,为交通流量预测任务对应的解码器的互补后空间特征。gcn(s
flow
)为第一空间特征,gcn(s
speed
⊙
p)为第二空间特征,norm[]是规范化层。
[0100]
对于交通速度预测任务,具体计算方式如下:
[0101][0102]
其中,s
speed
是交通速度预测任务中时间趋势感知自注意力层输出的时间特征,s
flow
为交通流量预测任务中时间趋势感知自注意力层输出的时间特征,gcn是图卷积神经网络,p为相关系数矩阵,为交通速度预测任务对应的解码器的互补后空间特征。gcn(s
speed
)为第一空间特征,gcn(s
flow
⊙
p)为第二空间特征,norm[]是规范化层。
[0103]
由上所述,在krcc的指导下进行了空间级别的特征抽取,使得从一个解码器中抽取出有效特征来对另一个解码器的特征进行增强。
[0104]
在一个实施例中,如图4所示,上述步骤s400具体包括如下步骤:
[0105]
步骤s410:基于实时交通流量数据和实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;
[0106]
具体地,参考上述步骤s310所述内容,获得相关系数矩阵。
[0107]
步骤s420:基于相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得节点特征;
[0108]
具体地,由于考虑了肯德尔秩相关系数,抽取另一个解码器的节点特征时,需要先对相关系数矩阵和另一个解码器的互补后空间特征采用卷积操作,再进行矩阵相乘获得节点特征。
[0109]
本实施例中,先对相关系数矩阵采用基于1x1卷积核的卷积操作,获得卷积结果;对另一个解码器的互补后空间特征同样采用基于1x1卷积核的卷积操作,获得卷积结果;将
两个卷积结果进行矩阵相乘,获得节点特征。
[0110]
步骤s430:融合互补后空间特征与节点特征,获得互补后节点特征。
[0111]
具体地,将节点特征与互补后空间特征进行特征向量相加,获得互补后节点特征。
[0112]
本实施例中,两个解码器分别对应着交通流量和交通速度的特征提取。
[0113]
对于交通流量预测任务,具体计算方式如下:
[0114][0115]
其中,是交通速度预测任务中的互补后空间特征,为交通流量预测任务中的互补后空间特征,conv是具有1x1的卷积核的卷积层,p为相关系数矩阵,为节点特征,为互补后节点特征,norm[]是规范化层。
[0116]
对于交通速度预测任务,具体计算方式如下:
[0117][0118]
其中,是交通速度预测任务中的互补后空间特征,为交通流量预测任务中的互补后空间特征,conv是具有1x1的卷积核的卷积层,p为相关系数矩阵,为节点特征,为互补后节点特征,norm[]是规范化层。
[0119]
由上所述,在krcc的指导下进行了节点级别的特征抽取。从一个解码器中抽取出有效特征来对另一个解码器的特征进行增强。
[0120]
在一个实施例中,如图5所示,上述步骤s100更具体地包括如下步骤:
[0121]
步骤s110:基于时间趋势感知自注意力层,提取时间特征;
[0122]
步骤s120:基于空间动态图卷积网络层,提取空间特征;
[0123]
步骤s130:基于时间特征和空间特征,获得历史时空特征。
[0124]
具体地,在对交通数据提取时间关系和时间特征方面,采用了时间趋势感知自注意力机制模块进行特征的抽取。在对交通数据的空间关系和空间特征方面,采用了空间动态图卷积网络模块进行特征的抽取。在编码器中将时间特征和空间特征进行交互,获得历史时空特征。其中,空间动态图卷积网络层中采用了空间动态图卷积网络模块(dyngcn),该模块将动态图上的表示学习建模为时间和空间信息的聚合。模型结合了图卷积神经网络(gcn)的空间卷积提取图上的结构信息,以及时间卷积神经网络(tcn)的因果卷积提取时序上的历史信息,同时,在空间卷积层加入了自适应的模型更新机制,使得模型参数随着图结构的变化而自适应地更新,是本领域的常用技术手段,在此不再赘述。
[0125]
由上所述,编码器对输入数据进行了编码,使得输入的特征充分进行充分的交互,并对其中存在的时空特征进行了抽取。
[0126]
示例性设备
[0127]
如图6所示,对应于上述基于transformer的多任务交通流预测方法,本发明实施例还提供一种基于transformer多任务交通流预测装置,上述基于transformer多任务交通流预测装置包括:
[0128]
历史时空特征提取模块600,用于将历史交通数据输入编码器进行特征提取,获得历史时空特征;
[0129]
数据输入模块610,用于将实时交通流量数据和实时交通速度数据各输入一个解码器并将所述历史时空特征分别输入至所述解码器中;
[0130]
空间特征模块620,用于在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;
[0131]
节点特征模块630,用于将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;
[0132]
输出模块640,用于基于所述互补后节点特征,获得交通流量预测结果和交通速度预测结果。
[0133]
具体的,本实施例中,上述基于transformer的多任务交通流预测装置的各模块的具体功能可以参照上述基于transformer的多任务交通流预测方法中的对应描述,在此不再赘述。
[0134]
基于上述实施例,本发明还提供了一种智能终端,其原理框图可以如图7所示。上述智能终端包括通过系统总线连接的处理器、存储器、网络接口以及显示屏。其中,该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和基于transformer的多任务交通流预测程序。该内存储器为非易失性存储介质中的操作系统和基于transformer的多任务交通流预测程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该基于transformer的多任务交通流预测程序被处理器执行时实现上述任意一种基于transformer的多任务交通流预测方法的步骤。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏。
[0135]
本领域技术人员可以理解,图7中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的智能终端的限定,具体的智能终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0136]
在一个实施例中,提供了一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的基于transformer的多任务交通流预测程序,上述基于transformer的多任务交通流预测程序被上述处理器执行时进行以下操作指令:
[0137]
将历史交通数据输入编码器进行特征提取,获得历史时空特征;
[0138]
将实时交通流量数据和实时交通速度数据各输入一个解码器并将所述历史时空特征分别输入至所述解码器中;
[0139]
在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;
[0140]
将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;
[0141]
基于所述互补后节点特征,获得交通流量预测结果和交通速度预测结果。
[0142]
可选的,所述从解码器中抽取第二空间特征,包括:
[0143]
基于所述实时交通流量数据和所述实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;
[0144]
获得解码器的解码层输出的时间特征;
[0145]
基于所述相关系数矩阵和所述时间特征,根据图卷积神经网络获得所述第二空间
特征。
[0146]
可选的,所述解码器的解码层中串接设有至少两层时间趋势感知自注意力层,最后的所述时间趋势感知自注意力层的输出结果为所述时间特征。
[0147]
可选的,所述时间趋势感知自注意力层的表达式为:
[0148]
selftrattention(q,k,v)=softmax(conv(q)
×
conv(k))
⊙
v,
[0149]
其中,conv表示的是在时间维度上的1x1的卷积,q为查询向量,k为键值向量,v为值向量。
[0150]
可选的,所述将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征,包括:
[0151]
基于所述实时交通流量数据和所述实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;
[0152]
基于所述相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得所述节点特征;
[0153]
融合所述互补后空间特征与所述节点特征,获得所述互补后节点特征。
[0154]
可选的,所述基于所述相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得所述节点特征,包括:
[0155]
对所述相关系数矩阵采用基于1x1卷积核的卷积操作,获得第一卷积结果;
[0156]
对所述另一个解码器的互补后空间特征采用基于1x1卷积核的卷积操作,获得第二卷积结果;
[0157]
将所述第一卷积结果与所述第二卷积结果进行向量相乘,获得所述节点特征。
[0158]
可选的,所述将历史交通数据输入编码器进行特征提取,获得历史时空特征,包括:
[0159]
基于时间趋势感知自注意力层,提取时间特征;
[0160]
基于空间动态图卷积网络层,提取空间特征;
[0161]
基于所述时间特征和所述空间特征,获得所述历史时空特征。
[0162]
本发明实施例还提供一种计算机可读存储介质,上述计算机可读存储介质上存储有基于transformer的多任务交通流预测程序,上述基于transformer的多任务交通流预测程序被处理器执行时实现本发明实施例提供的任意一种基于transformer的多任务交通流预测方法的步骤。
[0163]
应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0164]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0165]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0166]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0167]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以由另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
[0168]
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
[0169]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
技术特征:1.基于transformer的多任务交通流预测方法,包括交通流量预测任务及交通速度预测任务,其特征在于,所述方法包括:将历史交通数据输入编码器进行特征提取,获得历史时空特征;将实时交通流量数据和实时交通速度数据各输入一个解码器并将所述历史时空特征分别输入至所述解码器中;在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;基于所述互补后节点特征,获得交通流量预测结果和交通速度预测结果。2.如权利要求1所述的基于transformer的多任务交通流预测方法,其特征在于,所述从解码器中抽取第二空间特征,包括:基于所述实时交通流量数据和所述实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;获得解码器的解码层输出的时间特征;基于所述相关系数矩阵和所述时间特征,根据图卷积神经网络获得所述第二空间特征。3.如权利要求2所述的基于transformer的多任务交通流预测方法,其特征在于,所述解码器的解码层中串接设有至少两层时间趋势感知自注意力层,最后的所述时间趋势感知自注意力层的输出结果为所述时间特征。4.如权利要求3所述的基于transformer的多任务交通流预测方法,其特征在于,所述时间趋势感知自注意力层的表达式为:selftrattention(q,k,v)=softmax(conv(q)
×
conv(k))
⊙
v,其中,conv表示的是在时间维度上的1x1的卷积,q为查询向量,k为键值向量,v为值向量。5.如权利要求1所述的基于transformer的多任务交通流预测方法,其特征在于,所述将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征,包括:基于所述实时交通流量数据和所述实时交通速度数据,根据肯德尔秩相关系数获得相关系数矩阵;基于所述相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得所述节点特征;融合所述互补后空间特征与所述节点特征,获得所述互补后节点特征。6.如权利要求5所述的基于transformer的多任务交通流预测方法,其特征在于,所述基于所述相关系数矩阵和另一个解码器的互补后空间特征,采用卷积操作获得所述节点特征,包括:对所述相关系数矩阵采用基于1x1卷积核的卷积操作,获得第一卷积结果;对所述另一个解码器的互补后空间特征采用基于1x1卷积核的卷积操作,获得第二卷积结果;
将所述第一卷积结果与所述第二卷积结果进行向量相乘,获得所述节点特征。7.如权利要求1所述的基于transformer的多任务交通流预测方法,其特征在于,所述将历史交通数据输入编码器进行特征提取,获得历史时空特征,包括:基于时间趋势感知自注意力层,提取时间特征;基于空间动态图卷积网络层,提取空间特征;基于所述时间特征和所述空间特征,获得所述历史时空特征。8.基于transformer的多任务交通流预测装置,其特征在于,所述装置包括:历史时空特征提取模块,用于将历史交通数据输入编码器进行特征提取,获得历史时空特征;数据输入模块,用于将实时交通流量数据和实时交通速度数据各输入一个解码器并将所述历史时空特征分别输入至所述解码器中;空间特征模块,用于在每个解码器中提取第一空间特征并从另一个解码器中抽取第二空间特征,将所述第一空间特征与所述第二空间特征融合,获得每个解码器的互补后空间特征;节点特征模块,用于将所述互补后空间特征与从另一个解码器的互补后空间特征抽取的节点特征融合,获得每个解码器输出的互补后节点特征;输出模块,用于基于所述互补后节点特征,获得交通流量预测结果和交通速度预测结果。9.智能终端,其特征在于,所述智能终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于transformer的多任务交通流预测程序,所述基于transformer的多任务交通流预测程序被所述处理器执行时实现如权利要求1-7任意一项所述基于transformer的多任务交通流预测方法的步骤。10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于transformer的多任务交通流预测程序,所述基于transformer的多任务交通流预测程序被处理器执行时实现如权利要求1-7任意一项所述基于transformer的多任务交通流预测方法的步骤。
技术总结本发明公开了一种基于Transformer的多任务交通流预测方法、装置及终端,本发明方案通过设置一个编码器和两个解码器,使用两个编码器分别处理交通流量任务和交通速度任务,使用编码器提取历史交通数据的历史时空特征并输入至每个解码器中,以增强各个解码器中输入的实时交通数据的特征;而且每个解码器还从另一个解码器中层次性抽取空间特征和节点特征以与自身特征融合和互补,从而通过一个预测任务来增强另一个预测任务的特征,实现特征上相互促进,提高预测结果的精度。提高预测结果的精度。提高预测结果的精度。
技术研发人员:王耀威 张威风 陈杰 吴哲 张新峰 黄庆明
受保护的技术使用者:鹏城实验室
技术研发日:2022.06.13
技术公布日:2022/11/1