基于r-j9九游会真人

文档序号：35886999发布日期：2023-10-28 18:10阅读：4来源：国知局

基于r-c-r结构的时空卷积交通流预测方法及系统
技术领域
1.本发明涉及交通流预测技术领域，更具体的说是涉及基于r-c-r结构的时空卷积交通流预测方法及系统。

背景技术：

2.智能交通系统(intelligent traffic system，its)是将先进的信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术等有效地集成运用于整个地面交通管理系统而建立的一种在大范围内、全方位发挥作用的，实时、准确且高效的综合交通运输管理系统。而交通流量预测是智能交通系统重要组成部分之一，对于缓解交通拥堵、提高道路效率、规划城市建设、提供导航服务等方面具有重要意义。交通数据是同时受到时间因素和空间因素影响的数据类型，同时考虑两种因素的影响才是更加合理的。于是，使用rnn、lstm和gru等循环神经网络提取时间信息的同时使用cnn或gcn提取空间关联便成了交通流预测的首选之策。也因此有许多学者使用cnn、gcn、rnn的各种组合去对已有的交通流数据进行分析，以对下一时刻的交通流量进行预测，由此提出了许多的混合神经网络。
3.li m等提出了一种时空融合图神经网络(stfgnn)模型，该模型由两个子模块组成：一个是基于图卷积和门控循环单元(gru)的时空特征提取模块，另一个是基于多头自注意力机制和全连接层的时空特征融合模块。t.qi等提出了一种新的基于深度学习的异步扩张图卷积网络(adgcn)来为空间-时间图建模，挖掘了交通网络中的异步空间-时间相关性，并提出了异步空间-时间图卷积(astgc)操作来提取这种特殊关系。z.li等提出了一种基于图卷积神经网络(gcn)和长短期记忆网络(lstm)的混合深度神经网络，该网络由两个子网组成：一个是基于gcn的空间特征提取子网，另一个是基于lstm的时间特征提取子网。以上方法均为结合了多种神经网络进行构造的混合神经网络，且这几种方法均在特定数据集上取得了较好的成绩。
4.但目前的方法也普遍存在着不足之处，如现有技术中的astgcn方法，对时间维度特性的提取不够充分；现有技术中都采用rnn系列网络去捕获时间特征，而rnn网络存在的问题也是显而易见的，梯度消失与梯度爆炸限制了网络取得更好的交通流量预测效果的能力。
5.因此，如何提供一种基于r-c-r结构的时空卷积交通流预测方法及系统，对交通流数据浅层和深层的时空特征进行提取同时减少梯度消失对网络功能的限制，提高交通流量预测的准确度是本领域技术人员亟需解决的问题。

技术实现要素：

6.有鉴于此，本发明提供了一种基于r-c-r结构的时空卷积交通流预测方法及系统，针对已有方法对交通流时空特征学习不充分，将时间特征与空间特征进行割裂讨论，对时间与空间的动态相关性特征未充分考虑的问题，提出了astr-c-r模型，使用注意力机制使模型更快的收敛，采用了gcn与cnn结合的时空卷积模块进行浅层的时空特征提取，设计了
用双边resnet模块与convlstm模块组成的resnet-convlstm-resnet(r-c-r)残差结构来强化网络的记忆，以减少梯度消失对网络功能的限制，并将其作为深层时空特征提取层，以进一步获取更深层次的时空特征，更好的获取交通流量的时间-空间特征，提高交通流量预测的准确度。
7.为了实现上述目的，本发明采用如下技术方案：一种基于r-c-r结构的时空卷积交通流预测方法，包括：
8.获取交通流数据的训练集；
9.构建交通流预测模型；
10.将所述训练集输入到所述交通流预测模型中，对所述训练集进行预处理，得到预处理后的数据；
11.对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征；
12.采用convlstm网络作为核心模块，并辅以resnet网络，构建r-c-r结构的时空特征提取层，获取空间特征与时间特征的动态相关性；
13.经过多次迭代后，生成预测数据集，将所述预测数据集与真实值进行比较，得到最优交通流预测模型；
14.根据所述最优交通流预测模型，输入第一时间段交通流数据，得到第二时间段交通流数据的最优预测结果；
15.所述第一时间段早于所述第二时间段。
16.优选的，还包括：根据交通流数据构建交通路网图g＝《v,e,a》；
17.其中，v为交通路网图中的节点集，|v|＝n代表共有n个节点；e代表交通路网图中边的集合；a∈rn×n代表g的邻接矩阵；交通路网图g中不规则分布的探测器以相同的采样频率检测测量值f，每个节点在每个时间切片上生成一个长度为f的特征向量。
18.优选的，对所述训练集进行预处理包括：基于空间维度和时间维度注意力机制对所述训练集进行初始权重分配；
19.空间维度注意力机制表示如下：
[0020][0021][0022]
其中，是第r个时空模块的输入；c
r-1
为在第r层输入数据的通道数，当r＝1时，c0＝f；t
r-1
为第r-1个时空模块输出数据的时间序列长度；当r＝1时，t0＝t，t为当前数据的时间序列长度；vs、bs∈rn×n，w1、w2和w3均为可学习的参数；σ为sigmoid激活函数，s∈rn×n为空间注意力矩阵，s
i,j
表示空间节点i和空间节点j的依赖强度；s'
i,j
∈rn×n表示通过softmax函数计算得到的空间节点间相关性权重矩阵；
[0023]
时间维度注意力机制表示如下：
[0024][0025][0026]
其中，u1∈rn，u1、u2和u3均为可学习的参数；e为时间注意力矩阵；e
i,j
表示时间节点i和时间节点j的依赖强度；e'
i,j
表示通过softmax函数计算得到的时间节点间相关性权重矩阵。
[0027]
优选的，对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征，包括：基于图谱理论，对交通路网图进行卷积操作，得到图谱卷积的定义如下：
[0028][0029]
其中，代表图卷积操作，θ为卷积核，λ为特征值对角矩阵，u是拉普拉斯特征值分解l＝uλu
t
得到的傅里叶基，表示将信号x在基上做投影变换，其逆变换为
[0030]
使用chebyshev polynomials对上式进行处理，通过卷积核g
θ
提取以图中每个节点为中心的周边0到(k-1)th阶邻居的信息，初步提取数据的空间特征，得到下式：
[0031][0032]
其中，θm∈rm是一个多项式系数向量，为经计算得出的chebyshev polynomials，
⊙
表示哈达玛积，m是卷积核的尺寸，m表示第m阶chebyshev多项式；
[0033]
初步提取数据的空间特征后，再次进行卷积操作，初步提取数据的时间特征，结合卷积操作后公式如下：
[0034][0035]
其中，ψ为卷积操作的卷积核，relu是激活函数，r表示第r个时间步。
[0036]
优选的，所述r-c-r结构的时空特征提取层的公式表示如下：
[0037]
f(x)＝convlstm(f(x) μ1x) μ2x；
[0038]
其中，μ1，μ2为可学习调整的参数，将μ1，μ2的调整交由神经网络自动调整后获取预测结果。
[0039]
优选的，所述convlstm网络对数据的处理如下：
[0040]it
＝σ(w
xi
*x
t
w
hi
*h
t-1
w
ci
⊙ct-1
bi)；
[0041]ft
＝σ(w
xf
*x
t
w
hf
*h
t-1
w
cf
⊙ct-1
bf)；
[0042]ct
＝f
t
⊙ct-1
i
t
⊙
tanh(w
xc
*x
t
w
hc
*h
t-1
bc)；
[0043]ot
＝σ(w
xo
*x
t
w
ho
*h
t-1
w
co
⊙ct
bo)；
[0044]ht
＝o
t
⊙
tanh(c
t
)；
[0045]
式中*表示卷积运算，
⊙
表示哈达玛积，i
t
表示输入门，f
t
表示遗忘门，c
t
表示长记忆，h
t
表示短记忆，o
t
表示输出门；σ为sigmoid激活函数；x
t
为t时刻输入；w
*i
和bi分别为输入门的权重和阈值；w
*f
和bf分别为遗忘门的权重和阈值；w
*c
和bc分别为状态门的权重和阈值；w*o
和bo分别为输出门的权重和阈值。其中*所表示的卷积运算为convlstm相对传统lstm做出的显著改变，使用卷积替代输入门-状态门，状态门-状态门之间使用的前馈式神经网络处理方式，以此提高模型对空间数据局部特征提取的能力。
[0046]
优选的，所述resnet网络对数据的处理如下：
[0047]
f(x)＝f(x) x；
[0048]
式中，x表示输入的数据。
[0049]
优选的，使用平均绝对误差mae，均方根误差rmse，平均百分比误差mape作为评估指标，公式如下：
[0050][0051][0052][0053]
其中，n为测试数据集的数据总数，和yn分别为经过模型计算所得的预测结果和数据集中相应时刻的真实数值。
[0054]
优选的，一种基于r-c-r结构的时空卷积交通流预测系统，包括：
[0055]
数据获取模块，用于获取交通流数据的训练集；
[0056]
模型构建模块，用于构建交通流预测模型，所述交通流预测模型包括依次连接的输入模块、时空注意力模块、时空卷积模块、r-c-r网络模块、处理模块和输出模块；
[0057]
所述输入模块，用于输入所述训练集和第一时间段交通流数据；
[0058]
所述时空注意力模块，用于对所述训练集进行预处理，得到预处理后的数据；
[0059]
所述时空卷积模块，用于对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征；
[0060]
所述r-c-r网络模块，用于获取空间特征与时间特征的动态相关性；
[0061]
所述处理模块，用于生成预测数据集，并将所述预测数据集与真实值进行比较，得到最优交通流预测模型；
[0062]
所述输出模块，用于根据所述最优交通流预测模型和第一时间段交通流数据，输出第二时间段交通流数据的最优预测结果；所述第一时间段早于所述第二时间段。
[0063]
经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种基于r-c-r结构的时空卷积交通流预测方法及系统，包括：获取交通流数据的训练集；构建交通流预测模型；将所述训练集输入到所述交通流预测模型中，对所述训练集进行预处理，得到预处理后的数据；对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征；采用convlstm网络作为核心模块，并辅以resnet网络，构建r-c-r结构的时空特征提取层，获取空间特征与时间特征的动态相关性；经过多次迭代后，生成预测数据集，将所述预测数据集与真实值进行比较，得到最优交通流预测模型；根据所述最优交通流预测模型，输入第一时间段交通流数据，得到第二时间段交通流数据的最优预测结果；所述第一时间段早于所述第二时间段。
[0064]
本发明具有以下有益效果：它的空间-时间特征提取模块包含两个层次：深度空间-时间特征提取层和浅层空间-时间特征提取层。深度层采用convlstm作为核心模块，并辅以前后双resnet，解决了convlstm梯度消失的问题，提升了模型交通流量预测的准确率；浅层则使用chebyshevgcn和cnn进行初步的空间-时间特征提取。另外，还设计了一个时空注意力模块来辅助astr-c-r模型的训练，使模型达到快速收敛的效果；本发明对交通流时空特征充分学习，同时提取时间特征与空间特征，并对时间与空间的动态相关性特征充分考虑，使模型对交通流数据的预测结果更准确。
附图说明
[0065]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
[0066]
图1为本发明实施例提供的交通流预测模型示意图。
[0067]
图2为本发明实施例提供的交通路网图示意图。
[0068]
图3为本发明实施例提供的时空卷积模块示意图。
[0069]
图4为本发明实施例提供的r-c-r网络模块示意图。
[0070]
图5(a)为本发明实施例提供的以μ1为横轴，μ2为各簇的纵轴对pems04数据集预测的mae结果对比示意图。
[0071]
图5(b)为本发明实施例提供的以μ2为横轴，μ1为各簇的纵轴对pems04数据集预测的mae结果对比示意图。
[0072]
图6(a)为本发明实施例提供的以μ1为横轴，μ2为各簇的纵轴对pems04数据集预测的rmse结果对比示意图。
[0073]
图6(b)为本发明实施例提供的以μ2为横轴，μ1为各簇的纵轴对pems04数据集预测的rmse结果对比示意图。
[0074]
图7(a)为本发明实施例提供的以μ1为横轴，μ2为各簇的纵轴对pems04数据集预测的mape结果对比示意图。
[0075]
图7(b)为本发明实施例提供的以μ2为横轴，μ1为各簇的纵轴对pems04数据集预测的mape结果对比示意图。
具体实施方式
[0076]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0077]
本发明实施例公开了一种基于r-c-r结构的时空卷积交通流预测方法及系统，包括：获取交通流数据的训练集；构建交通流预测模型；将所述训练集输入到所述交通流预测模型中，对所述训练集进行预处理，得到预处理后的数据；对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征；采用convlstm网络作为核心模块，并辅以
resnet网络，构建r-c-r结构的时空特征提取层，获取空间特征与时间特征的动态相关性；经过多次迭代后，生成预测数据集，将所述预测数据集与真实值进行比较，得到最优交通流预测模型；根据所述最优交通流预测模型，输入第一时间段交通流数据，得到第二时间段交通流数据的最优预测结果；所述第一时间段早于所述第二时间段。
[0078]
本发明实施例解决了convlstm网络梯度消失的问题，提升了模型交通流量预测的准确率，且能够使模型达到快速收敛的效果，对交通流数据的预测结果更准确。
[0079]
在本发明的一个具体实施例中，本发明实施例公开了一种基于r-c-r结构的时空卷积交通流预测方法，如图1所示，包括：获取交通流数据的训练集；构建交通流预测模型；将所述训练集输入到所述交通流预测模型中，对所述训练集进行预处理，得到预处理后的数据；对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征；采用convlstm网络作为核心模块，并辅以resnet网络，构建r-c-r结构的时空特征提取层，获取空间特征与时间特征的动态相关性；经过多次迭代后，生成预测数据集，将所述预测数据集与真实值进行比较，得到最优交通流预测模型；根据所述最优交通流预测模型，输入第一时间段交通流数据，得到第二时间段交通流数据的最优预测结果；所述第一时间段早于所述第二时间段。
[0080]
在本发明的一个具体实施例中，第一时间段和第二时间段可以设置为一个小时，也可以设置为2个小时或者其他时间段；例如：第一时间段可以设置为北京时间早上5点到早上6点；第二时间段可以设置为北京时间早上6点到早上7点；将已有的北京时间早上5点到早上6点的交通流数据输入到训练好的最优交通流预测模型中，预测得到北京时间早上6点到早上7点的交通流数据的最优预测结果。
[0081]
其中，所述交通流预测模型包括依次连接的输入模块、时空注意力模块、时空卷积模块、r-c-r网络模块、处理模块和输出模块。
[0082]
具体的，还包括：根据交通流数据构建交通路网图g＝《v,e,a》，如图2所示；由于交通流彼此存在的上下游相互影响的空间关系可近似的看作一个图，于是本发明实施例使用g＝《v,e,a》，来定义一个交通网络。其中v为图中的节点集，|v|＝n代表共有n个节点。e代表图中边的集合，也即，代表两个节点是否可以直接到达。a∈rn×n代表图g的邻接矩阵。交通路网图g中不规则分布的探测器以相同的采样频率检测测量值f，即每个节点在每个时间切片上生成一个长度为f的特征向量。
[0083]
具体的，本发明实施例使用了由注意力机制为基础的时空注意力模块，所述时空注意力模块包括空间维度注意力机制和时间维度注意力机制；基于空间维度和时间维度注意力机制对所述训练集进行初始权重分配；使交通流预测模型可以更好地捕获动态的时空特征，对模型中起到更多作用的分支和节点投入更多的关注，本模块方法的描述可由以下公式定义：
[0084][0085]
[0086][0087][0088]
公式(1)和公式(2)为空间维度注意力机制的表示，其中公式(1)和公式(2)为空间维度注意力机制的表示，其中是第r个时空模块的输入。c
r-1
为在第r层输入数据的通道数，当r＝1时，c0＝f。t
r-1
为第r-1个时空模块输出数据的时间序列长度。当r＝1时，t0＝t，t为当前数据的时间序列长度。vs，bs∈rn×n，，w1、w2和w3均为可学习的参数。σ为sigmoid激活函数，s∈rn×n为空间注意力矩阵，矩阵数值代表数据中不同部分的重要程度。s
i,j
表示空间节点i和空间节点j的依赖强度；s'
i,j
∈rn×n为表示通过softmax函数计算得到的空间节点间相关性权重矩阵。
[0089]
公式(3)和公式94)为时间维度注意力机制的描述。u1∈rn，u1、u2和u3为可学习的参数。矩阵e代表不同输入间的时间相关性，e为时间注意力矩阵，是经过softmax归一化的矩阵；e
i,j
表示时间节点i和时间节点j的依赖强度；e'
i,j
表示通过softmax函数计算得到的时间节点间相关性权重矩阵。
[0090]
具体的，时空卷积模块通过卷积处理初步提取数据的空间特征和时间特征作为浅层时空特征提取层；如图3所示，在交通流量预测这一研究中，本发明实施例将交通路网看作一个图的形式，而路网图是一个拓扑图，为了应对路网图的这一特征，并充分地对其进行空间特征提取，本发明实施例采用了基于图谱理论实现拓扑图卷积操作的chebyshev gcn。在图谱分析中，图的性质是由对图的laplacian矩阵和矩阵的特征值分析得到的。图的laplacian矩阵由l＝d-a定义，将该式进行归一化得其中，a为图g的邻接矩阵，in为单位矩阵，d∈rn×n是由节点的度组成的对角矩阵。u是laplacian特征值分解l＝uλu
t
得到的傅里叶基，其中λ＝diag([λ0,
…
,λ
n-1
])∈rn×n为特征值对角矩阵。其n个特征向量线性无关且相互正交，将其作为变换的基，将信号x在基上做投影变换得到其逆变换为于是得到图谱卷积的定义如下：
[0091][0092]
其中代表图卷积操作，θ为卷积核，即对信号x以θ作为卷积核做图卷积处理。由于公式(5)的计算复杂度较高，因此采用了chebyshevpolynomials做如下公式所示的近似表达：
[0093]
[0094]
其中θm∈rm是一个多项式系数向量，为经计算得出的chebyshev polynomials(切比雪夫多项式)，λ
max
为laplacian矩阵的最大特征值。m是卷积核的尺寸，m表示第m阶chebyshev多项式，它确定了卷积的最大半径。第m阶切比雪夫多项式的递归定义为tm(x)＝2xt
m-1
(x)-t
m-2
(x)。当m＝0时，t0(x)＝1，当m＝1时，t1(x)＝x。使用切比雪夫多项式的近似展开来解决这个问题，相当于通过卷积核g
θ
提取以图中每个节点为中心的周边0到(k-1)th阶邻居的信息。为了使模型可以适应动态的节点相关性，采用s'∈rn×n，
⊙
表示哈达玛积，于是公式(6)可以再次进行整理变形为：
[0095][0096]
在公式(7)的基础上再次进行卷积操作，初步提取时间维度的特征，以第r层为例，结合卷积操作后公式变为如下形式：
[0097][0098]
其中，ψ为卷积操作的卷积核，是可通过学习调整的参数。relu是激活函数。r表示第r个时间步。
[0099]
现有的astgcn方法，对时间维度特性的提取不够充分，而且rnn网络存在梯度消失与梯度爆炸的问题，限制了网络取得更好的预测效果的能力。因此为了解决rnn系列网络梯度消失的问题，本发明实施例设计了用双边resnet模块与convlstm模块组成的resnet-convlstm-resnet(r-c-r)残差结构来强化网络的记忆，以减少梯度消失对网络功能的限制，并将其作为深层时空特征提取层，以进一步获取时间特征与空间特征的动态相关性。
[0100]
具体的，对于r-c-r网络模块，采用convlstm网络作为核心模块，并辅以resnet网络，构建r-c-r结构的时空特征提取层，获取空间特征与时间特征的动态相关性；对交通流数据进行深层的空间特征和时间特征捕获；如图4所示，本模块中主要的时空提取器为convlstm，作为能够兼顾时间特征与空间特征的网络结构，convlstm在本模块的表现也相当令人满意。但是随之而来的也有rnn系列网络的通病，网络会出现梯度消失的问题，因此，本发明实施例设计了resnet-convlstm-resnet(r-c-r)结构网络来解决这一问题。
[0101]
convlstm是一种用于时空预测的循环神经网络，它将卷积结构运用到了输入到状态和状态到状态的转换之中，通过输入与相邻节点的过去状态来确定当前节点的未来状态。convlstm的提出便是用于预测任务，它能够很好的解决lstm网络不能利用数据中的空间信息的缺点，可以同时捕捉数据中的时间和空间的动态相关性，适用于时空数据的处理。而本发明的交通流量预测任务很好的符合了这个特征，交通流之间既有随着时间改变而变化的时间信息，又有在整个图空间中道路上下游相互影响的空间信息。
[0102]
具体的，所述convlstm网络对数据的处理如下：
[0103]it
＝σ(w
xi
*x
t
w
hi
*h
t-1
w
ci
⊙ct-1
bi)
ꢀꢀ
(9)
[0104]ft
＝σ(w
xf
*x
t
w
hf
*h
t-1
w
cf
⊙ct-1
bf)
ꢀꢀ
(10)
[0105]ct
＝f
t
⊙ct-1
i
t
⊙
tanh(w
xc
*x
t
w
hc
*h
t-1
bc)
ꢀꢀ
(11)
[0106]ot
＝σ(w
xo
*x
t
w
ho
*h
t-1
w
co
⊙ct
bo)
ꢀꢀ
(12)
[0107]ht
＝o
t
⊙
tanh(c
t
)
ꢀꢀ
(13)
[0108]
式中*表示卷积运算，
⊙
表示哈达玛积。i
t
表示输入门，f
t
表示遗忘门，c
t
表示长记忆，h
t
表示短记忆，o
t
表示输出门；σ为sigmoid激活函数；x
t
为t时刻输入；w
*i
和bi分别为输入门的权重和阈值；w
*f
和bf分别为遗忘门的权重和阈值；w
*c
和bc分别为状态门的权重和阈值；w
*o
和bo分别为输出门的权重和阈值。其中*所表示的卷积运算为convlstm相对传统lstm做出的显著改变，使用卷积替代输入门-状态门，状态门-状态门之间使用的前馈式神经网络处理方式，以此提高模型对提取交通流数据中时间与空间动态相关性的能力。
[0109]
resnet是残差神经网络的简称，是由微软研究院的何恺明等人于2015年提出的一种深度卷积神经网络。resnet的主要特点是引入了残差模块，即在每个卷积层后面添加一个跳跃连接(skip connection)，使得输入可以直接传递到输出，从而缓解了深度网络中的梯度消失和退化问题。
[0110]
resnet有着不俗的能力：可以构建非常深的网络，例如resnet-152有152层，而不会降低训练效率和预测性能。可以有效地提取图像中的高层语义特征，提高了图像分类、目标检测、语义分割等任务的准确率。可以方便地进行模型微调，即在预训练好的模型基础上修改部分参数或结构来适应新的数据集或任务。
[0111]
当然resnet也有一些缺点，比如当设置的模型层数过多时，如使用resnet-152时，网络会需要大量的计算资源和存储空间，因为此时模型参数数量较未采用resnet-152时增加了许多。随之而来的还有模型复杂度的提高，并且还需要解决因此带来的过拟合问题，即需要更多的数据。为了解决resnet的如上缺点，本发明实施例选择降低resnet的层数，以期消耗更少的资源来获得较好的结果。
[0112]
具体的，所述resnet网络对数据的处理如下：
[0113]
f(x)＝f(x) x
ꢀꢀ
(14)
[0114]
式中，x表示输入的数据。
[0115]
具体的，所述r-c-r结构的时空特征提取层的公式表示如下：
[0116]
f(x)＝convlstm(f(x) μ1x) μ2x
ꢀꢀ
(15)
[0117]
其中，μ1，μ2为可学习调整的参数，本发明实施例也对这两项参数进行了各种组合下模型效果的对比。本发明实施例使用人工修改μ1，μ2的值以及通过神经网络的反射传播机制对μ1，μ2调整，通过具体的值比较μ1，μ2值的变化对模型效果的影响，并在将μ1，μ2的调整交由神经网络自动调整后，经模型多次迭代，获取到了最优的预测结果。
[0118]
实验设置
[0119]
本发明实施例中，实验的检验在nvidia a10显卡上进行，基于pytorch框架进行模型搭建，可以设置学习率大小为0.005，模型训练的总轮次设置为80，chebyshev polynomials中的参数m可以设置为3。在模型中，时空卷积模块的时间卷积层和空间卷积层的卷积核大小可以设置为64。在深层时空特征提取层中可以将μ1，μ2分别设置为0.1和0.2，或者其他数值。
[0120]
使用平均绝对误差mae，均方根误差rmse，平均百分比误差mape作为评估指标，三个评价指标的计算公式如公式(16)-公式(18)所示。
[0121][0122][0123][0124]
其中，n为测试集的数据总数，和yn分别为经过模型计算所得的预测结果和数据集中相应时刻的真实数值。
[0125]
在两个公开的真实数据集pems04和pems08上进行实验，数据集包含的信息如表1所示。
[0126]
表1
[0127][0128]
pems04和pems08两个数据集的数据收集频率均为5分钟一次，将数据集以6：2：2的比例分割，分别作为训练集、测试集和验证集。
[0129]
消融实验
[0130]
本发明实施例对模型进行了消融实验，检验模型中深层时空特征提取层的有效性以及深层时空特征提取层中各模块的有效性。
[0131]
将模型分别进行分割退化，得到仅包含res1的模型—astr-c-r_res1，仅包含convlstm的astr-c-r_convlstm，仅包含res1-convlstm的模型—astr-c-r_res1-convlstm，仅包含res2-convlstm的astr-c-r_res2-convlstm，以及模型的完全体astr-c-r(交通流预测模型)。各个消融条件下的模型对比效果如表2所示：
[0132]
表2
[0133]
[0134][0135]
经实验结果对比，可发现在各个经过消融的模型下效果均不如astr-c-r，这一结论在pems04数据集上体现的更加明显，在仅含有时空卷积模块时，模型甚至不能在同样的训练次数下收敛，所得结果的各项评价指标都异常的高。而在加入convlstm网络作为深层时空特征提取器时，整体表现提升很多，也证明了在原模型中加入convlstm模块是合理的。随着res1和res2的加入，模型效果有着进一步的提升，在所有的模块都到位之后，astr-c-r模型也得到了最好的效果。上表的结果也证明了本发明实施例所设计的深度特征提取模块是有效的。
[0136]
对比实验
[0137]
在对比实验中，本发明实施例选定以下方法作为模型实验结果的对比基线，以下方法涉及了现有技术基于参数的方法以及基于深度学习的方法，其中基于深度学习类的方法为在本领域被广泛认同或在所讨论数据集上取得很好效果的经典的方法。
[0138]
ha：历史平均值。历史平均模型根据训练集数据中相应时间历史流入和流出的平均值来预测测试集未来的交通流量。
[0139]
svr：support vector regression，使用线性支持向量机进行回归任务。
[0140]
lstm：长短期记忆网络。特殊的rnn网络，可以有效处理时序数据，通过门控机制一定程度上解决了梯度消失和长期记忆问题。
[0141]
dcrnn：使用randomwalk捕获空间依赖，使用定时采样的编码器-解码器捕获时间依赖性的扩散卷积递归神经网络。
[0142]
stgcn：时空图卷积网络。基于空间方法的时空卷积模型，使用chebnet编码空间信息。
[0143]
astgcn：使用注意力机制辅助学习时空特征，将交通流量预测任务以路网图为背景做定义，并将数据分为最近一小时，最近一天，最近一周三种时间跨度来分别处理。但在本实验中为保证对比的公平性，实验中不使用其多时间特征部分的模型。stsgcn：时空图卷积网络。通过构建局部时空图来同步地捕获不同时间和节点间信息。
[0144]
本实验所提出的方法与其他方法在pems04与pems08数据集上的结果展示如表3所示。
[0145]
表3
[0146][0147]
结果分析
[0148]
在模型设计中本发明实施例对μ1和μ2设置了不同的值，以调节原数据对网络预测的影响，避免过大比例的原数据对训练过程中经网络学习后生成的数据重要性的覆盖，也要使原数据能够起到resnet网络解决convlstm梯度爆炸与梯度消失的问题。为了探寻convlstm与resnet残差结构最合适的权重值，本发明实施例记录了过程中不同res1和res2权重对网络预测结果的影响。
[0149]
结果对比如下图5(a)，图5(b)，图6(a)，图6(b)，图7(a)，图7(b)所示。为不同μ1和μ2设置下的模型对pems04数据集预测的结果，本发明实施例选取各权重下的mae，rmse以及mape作为结果的体现，各组图中的(a)图所对应的为以μ1为横轴，以μ2为各簇的纵轴；(b)图为以μ2为横轴，以μ1为各簇的纵轴。图中的虚线所表示的为相对于横坐标为0.1时的簇整体的线性变化趋势。由图中的虚线可知，(a)系列图的整体变化趋势相较(b)系列图的整体变化趋势更大，也就意味着，μ1的变化对模型效果的影响更为明显，且随着μ1的增加模型的效果变的更差。这一结论在实验结果的mae，rmse，mape上均有体现。
[0150]
为进一步探寻μ1和μ2变化对模型预测结果的影响是否可从数学层面给予充分的肯定，本发明实施例对实验所得的结果进行了方差分析，如表4所示：
[0151]
表4
[0152][0153]
关于μ1和μ2对模型效果的影响，本发明实施例对所得到的结果进行了方差分析，方差分析过程所得到的中间值如表4所示。在置信度为99％的前提下，μ1的f值约为0.878697，小于f
0.01
(9，81)＝2.6344，故可得μ1对模型效果的影响是显著的。同理，μ2的f值约为2.608094，小于f
0.01
(9，81)＝2.6344，可知μ2对模型效果的影响是显著的。故从数学层面分析本发明实施例的实验数据后可知，本发明实施例模型的效果受μ1和μ2值的影响显著，在调
整μ1和μ2到合适的值时，模型可以发挥更好的效果。并且，由实验结果与图5(a)，图5(b)，图6(a)，图6(b)，图7(a)，图7(b)相比，可知表现更好的μ1和μ2应在值较小的范围内。当μ1和μ2的变化步长单位为0.1时，在μ1＝0.1，μ2＝0.2时取得了当前模型最好的表现结果。当将参数μ1和μ2的调整交由神经网络的反射传播机制时，实验得到了最优的结果，如表3所示。
[0154]
本发明实施例提供的astr-c-r是一种新颖的交通流量预测方法，旨在更好地获取空间-时间特征。其中，它的空间-时间特征提取模块包含两个层次：深层时空特征提取层和浅层时空特征提取层。深层时空特征提取层采用convlstm作为核心模块，并辅以前后resnet网络；浅层时空特征提取层则使用chebyshev gcn和cnn进行初步的空间特征和时间特征提取。另外，还设计了一个时空注意力模块来辅助astr-c-r模型的训练。
[0155]
本发明实施例提出以convlstm为主特征提取器的stblock，在对数据进行空间特征提取的同时又保证了对时间特征的捕获，解决现有方法对时间与空间的动态相关性关注度不足的问题。使用双边resnet模块组成的r-c-r结构解决了convlstm梯度消失的问题，提升了模型交通流量预测的准确率。本发明实施例在pems04与pems08数据集上进行了测试，相对基线方法取得了较好的效果。并讨论了r-c-r结构中不同resnet权重对模型准确度的影响。在智能交通系统的工作中，能够灵敏准确地提前预知下一时刻的交通状态变化，做到更加准确的交通流量预测；为城市缓解交通压力，减少市民在路途中消耗的时间。
[0156]
本发明实施例还提供了一种基于r-c-r结构的时空卷积交通流预测系统，包括：
[0157]
数据获取模块，用于获取交通流数据的训练集；
[0158]
模型构建模块，用于构建交通流预测模型，所述交通流预测模型包括依次连接的输入模块、时空注意力模块、时空卷积模块、r-c-r网络模块、处理模块和输出模块；
[0159]
所述输入模块，用于输入所述训练集和第一时间段交通流数据；
[0160]
所述时空注意力模块，用于对所述训练集进行预处理，得到预处理后的数据；
[0161]
所述时空卷积模块，用于对预处理后的数据进行时空卷积处理，初步提取数据的空间特征和时间特征；
[0162]
所述r-c-r网络模块，用于获取空间特征与时间特征的动态相关性；
[0163]
所述处理模块，用于生成预测数据集，并将所述预测数据集与真实值进行比较，得到最优交通流预测模型；
[0164]
所述输出模块，用于根据所述最优交通流预测模型和第一时间段交通流数据，输出第二时间段交通流数据的最优预测结果；所述第一时间段早于所述第二时间段。
[0165]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0166]
对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2