1.本发明属于地学统计与空间分析应用领域,特别涉及一种基于动态人口流动矩阵空间滤 值的新冠时空建模预测方法。
背景技术:2.传染病的产生、爆发和流行会对人类健康和经济产生巨大影响。其中,在2019年12月 首次报告的新型冠状病毒肺炎(coronavirus disease 2019,covid-19),简称“新冠肺炎”。开 展新发传染病的流行特征、影响因素和传播风险研究,对完善疾病防控策略和措施具有重大 意义。
3.在此背景下,研究人员针对新冠肺炎的时间趋势变化、节点预测、轨迹溯源、健康风险 因子等方面展开了一系列研究。其中,明确新发传染病传播与健康风险因素的关系是实现其 科学预警和防控的前提。已有研究结果表明,多种因素可影响新冠肺炎的传播扩散速度,如 新冠肺炎的传播可能与温度、降水、相对湿度、风速和空气质量等环境因子有关,也与人口 流动、公共交通、政府政策有关。
4.空间流行病的爆发及其健康风险因子空间的分布存在着很强的空间关联性,病例的爆发 极有可能产生空间积聚效应。而传统统计模型如普通线性回归对新冠肺炎与健康风险因素关 系研究中没有考虑到空间关联对结果产生的影响。虽然一些空间回归分析模型如空间自回归 模型和地理加权回归模型,将空间效应的影响加入到模型中,考虑了空间自相关性导致的方 差膨胀效应,具有更高的模型拟合优度和模型稳健性。
5.相比传统空间关联关系,人口流动网络邻接关系对疫情的扩散也起着直接影响。随着交 通方式的发展,人员流动物质交换更加便利频繁,传统的空间邻接关系(如邻市,邻省)可 能不能完全反映研究单元之间关联程度。以热门城市为例,其它地区与其之间的交互可能会 克服原有空间距离,呈现出比空间临近的城市更强的人口流动规模。而现有的空间回归模型 大多只考虑空间关联,对人口流动网络关联影响的建模研究较少。
6.疫情的传播在时间上也存在极强的关联性。疫情的发展不仅与同时刻健康风险因素有交 互作用,也受到过去疫情基本状态以及健康风险因素的影响,具有时间自相关性和时间滞后 效应。目前针对新冠时间变化趋势分析的大多基于时间序列框架,即以某一国家或地区为研 究区域,利用新冠肺炎历史数据模拟不同阶段的发病水平。以经典传染病传播动力学模型 (seir)为例,通过参考经验模型设定初设参数,并通过现有历史疫情数据调参来预测的传 播,并通过估计相应的参数来评估干预策略的有效性。还有一些学者使用深度学习的方法来 预测covid-19变化趋势和转折点。基于传染病传播动力学模型和基于深度学习框架的模型 虽然能够提高在传染病研究中时间序列模拟和预测的精度,但其复杂的内在原理降低了模型 的可解释性,同时,这些时间序列模型仅考虑时间效应的影响,未同时考虑空间效应的影响。
7.综上所述,对于新冠传播与健康风险因素建模过程中,缺乏对空间、时间效应以及人口 流动网络关系的同时考虑,因此,亟待提供一种基于动态人口流动矩阵空间滤值的新
冠时空 建模预测方法,为新冠传播与健康风险因素之间时空关系描述及预测提供基础支撑。
技术实现要素:8.本发明的目的在于提供一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法, 从而同时解决在新冠疫情与健康风险影响因素建模过程中空间和时间效应对模型造成的影响, 更加准确地描述新冠疫情健康风险影响因素的交互关系,在考虑时空关系的前提下提高新冠 疫情建模精度。
9.本发明提供一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,包括以下步 骤:
10.步骤1,数据获取与处理,包括获取新冠疫情数据及与新冠疫情传播相关的数据,对数据 产品进行预处理和筛选,用于后续建模;
11.步骤2,构建空间邻接矩阵,包括根据空间单元的空间邻接关系构建邻接矩阵w,矩阵 单元值表示研究单元之间的空间邻接权重;
12.步骤3,构建人口流动网络邻接矩阵,包括获取疫情期间各个时间节点研究单元之间的 人口流动数据,根据人口流动的强弱关系,对每一个时间节点t构建对应人口流动网络邻接 矩阵f
t
,矩阵单元值表示在时间节点t研究单元之间人口流动交互的强弱;
13.步骤4,构建时间邻接矩阵,包括将一维时间序列扩充为二维邻接矩阵t,矩阵单元值t
ij
对应表示时间节点i与时间节点j之间的时间邻接权重;
14.步骤5,空间邻接关系的时空扩展,包括将步骤2中构建的空间邻接矩阵w与步骤4中 构建的时间邻接矩阵进行克罗内克积运算,对空间邻接矩阵进行时间上的张量扩展,得到空 间时空邻接矩阵wt,矩阵单元值表示在时间节点t研究单元之间人口流动交互的强弱;
15.步骤6,人口流动网络邻接关系的时空扩展,包括将步骤3中对每个时间节点t构建的人 口流动网络邻接矩阵f
t
与步骤4中构建的时间邻接矩阵进行克罗内克积运算,得到人口流动 时空邻接矩阵f
t
t;将所有计算得到的时空人口流动邻接矩阵进行求和,得到最终整体人口流 动时空邻接矩阵ft;
16.步骤7,时空特征向量的提取与筛选,包括将步骤5和步骤6中得到的时空邻接矩阵wt 和ft进行中心化,得到中心化时空矩阵wct和fct;对中心化后的矩阵计算特征值和特征向 量;将特征向量根据预设阈值初筛,并用stepwise方法对初筛后的特征向量进行再次筛选, 最终作为空间时空影响因素和人口流动时空影响因素加入到建模过程中;
17.步骤8,构建基于动态人口流动矩阵时空滤值的新冠疫情回归模型,包括将步骤1中筛 选的数据以及步骤7中筛选出的空间时空特征向量ev
wt
、人口流动时空特征向量ev
ft
作为自 变量加入到回归模型中,对新冠疫情数据进行建模预测和评价。
18.而且,步骤1中,与新冠疫情传播相关的数据包括但不限于人口密度、人口年龄结构、 受教育程度、gdp、人口活动强度、气温、气压、风速、降水和海拔。
19.而且,步骤2中,建立空间邻接权重矩阵的方式采用rock邻接,bishop邻接或queen邻 接;或者采用基于距离的空间权重方式代替邻接关系。
20.而且,步骤3中,不同时间节点的单元人口流动交互特征不同,对研究时间段内的
所有 时间节点分别构建人口流动网络邻接矩阵f
t
,t=0,1,2
…
,p,p表示时空建模中的时间维度。
21.而且,步骤4中,时间权重的定义为,选择前后n天定义为邻接,权重设置为1,超过前 后n天的时间定义为非邻接,权重设置为0;或者采用基于时间距离的权重计算方式。
22.而且,步骤5和步骤6中,矩阵的时空扩展包括时空同生扩展与时空滞后扩展两种,时 空同生扩展只考虑不同时间节点研究单元与其本身之间的关联,而不考虑其在不同时间节点 对其它单元所造成的影响;时空滞后扩展不仅考虑不同时间节点研究单元与其本身之间的关 联,也考虑研究单元在不同时间节点对其它单元所造成的影响。
23.而且,步骤8中,建模过程包括以下处理,
24.回归模型的建立,包括将步骤1中筛选出的与新冠疫情传播相关的健康影响因子集合x 与步骤7中stepwise筛选后得到的时空特征向量集合作为自变量,新冠疫情感染率作为因变 量ifr,建立回归模型;
25.模型精度评价,包括选择模型拟合优度、均方根误差和极大似然值统计指标对模型进行 精度评价。
26.本发明所提供的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,同时考 虑了空间自相关效应、时间自相关和时间滞后效应以及人口动态流动网络交互效应,从而更 准确地描述新冠疫情与健康风险影响因素的交互关系,在考虑时空关系的前提下提高新冠疫 情建模精度。
附图说明
27.图1为本发明实施例流程图。
28.图2为本发明实施例数据预处理流程图。
29.图3为本发明实施例步骤3中人口流动网络邻接矩阵示意图。
30.图4为本发明实施例步骤5中时空同生关系和时空滞后关系示意图。
具体实施方式
31.为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进 一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限 定本发明。
32.本发明要解决的核心问题是:健康风险因子对新冠疫情传播的影响存在极强的空间关联 和时间关联。其中,人口流动网络关系对新冠疫情传播建模尤为重要。在新冠疫情与其健康 风险因子的建模中,其空间自相关效应、时间关联效应不满足现有模型的前提假设,且对于 人口流动网络关系的在建模过程中的影响较为缺乏。本发明通过构建基于动态人口流动矩阵 空间滤值的新冠疫情时空回归模型,在考虑人口流动网络关系的前提下,解决空间自相关、 人口流动网络关联和时间关联效应对建模的影响,从而提升新冠疫情与健康风险因子建模的 精度,为新冠疫情以及其它传染病的分析与防控提供重要参考依据。
33.本发明通过引入人口流动网络矩阵来补充考虑空间单元克服空间距离而产生的网络自相 关关系,并引入时间矩阵对空间邻接矩阵和人口流动网络矩阵进行时空扩展。通过对时空矩 阵的特征分解和筛选,得到空间时空特征向量和人口流动时空特征向量加入
到模型之中,提 高了新冠疫情时空建模的预测准确性。
34.参见图1,本发明实施例提供的一种基于动态人口流动矩阵空间滤值的新冠时空建模预 测方法,包括如下步骤:
35.步骤1:数据获取与处理。见图2,包括以下步骤:
36.步骤1.1:获取与预处理数据。收集逐日新冠疫情感染人数数据,以及与新冠疫情传播相 关的健康风险因子数据(环境数据等等)包括但不限于人口密度、人口年龄结构、受教育程 度、gdp、人口活动强度、气温、气压、风速、降水、海拔等。对数据集中所有变量进行描述 性统计分析,对异常值、空值等进行处理,根据具体情况,可选择插值方法插补或直接剔除, 并保证数据有统一的时间分辨率和空间分辨率避免由于异常值和空值造成的非必要误差。
37.步骤1.2:数据正态性检验和转换。用直方图检验数据是否正态或近似正态分布,若数据 存在严重偏态,则采用box-cox方法对数据进行正态变换。box-cox变换公式如下:
[0038][0039]
其中y为新冠感染人数数据,pow为极大似然法估计得到的box-cox变换参数。转换后 符合建模过程要求数据呈正态分布的原假设。
[0040]
步骤1.3:数据归一化处理。对自变量集合(健康风险因子)进行归一化处理,使得数据 分布在0到1之间,从而便于模型系数分析和比较。归一化公式如下:
[0041]
x
normmalized
=(x-x
min
)/(x
max-x
min
)
[0042]
其中x
normalized
是归一化后的因子x,x
max
和x
min
分别为因子x的最大值和最小值。
[0043]
步骤1.4:相关性检验和多重共线性检验。采用皮尔逊系数检验因变量与自变量之间的相 关性。采用计算vif值得方法检验自变量间是否存在多重共线性。若vif值小于10,自变量 间不存在明显多重共线性,将所有变量保留加入到后续建模中;若vif值大于10,则存在多 重共线性,按vif值大小依次剔除vif值大于10的变量,并再次计算vif值,直至所有余 下变量vif值均小于10,将余下变量保留加入到后续建模中,从而避免因多重共线性导致的 模型过拟合问题。
[0044]
步骤2:构建空间邻接矩阵。根据空间单元的空间邻接关系构建邻接矩阵w,矩阵单元 值表示研究单元之间的空间邻接权重。
[0045]
常用建立空间邻接权重矩阵的方式有rock邻接,bishop邻接,queen邻接等;除了邻接 关系,也可采用基于距离的空间权重方式。
[0046]
以queen相邻为例,每个单元与其有共同边或者共同点的单元具有邻接关系,权重值为 1,非邻接单元的权重值为0。
[0047]
步骤3:构建人口流动网络邻接矩阵。根据每一个时间节点t内人口流动的强弱关系构建 人口流动网络邻接矩阵f
t
,包括获取疫情期间各个时间节点研究单元之间的人口流动数据, 根据人口流动的强弱关系,对每一个时间节点t构建对应人口流动网络邻接矩阵f
t
,矩阵单 元值表示在时间节点t研究单元之间人口流动交互的强弱。
[0048]
不同时间节点的单元人口流动交互特征不同,需要对研究时间段内的所有时间节点分别 构建人口流动网络邻接矩阵f
t
(t=0,1,2
…
,p),p表示时空建模中的时间维度,在
此研究中即研 究天数。
[0049]
参见图3,以天尺度为例,在第t天,起始单元i到目标单元j的流入人口规模为f
i,j,t
, f
i,j,t
越大,表示研究单元i到j之间在第t天的人口交互强度越强。人口流动网络邻接矩阵f
t
中第i行,第j列的单元值记为f
t(i,j)
,其中f
t(i,j)
=f
i,j,t
。
[0050]
步骤4:构建时间邻接矩阵。将一维时间序列扩充为二维邻接矩阵t,矩阵单元值t
ij
对应 表示时间节点i与时间节点j之间的时间邻接权重。以基于时间距离的矩阵权重计算方法为 例,ti=i,其中i为第i天的时间id,第i天与第j天的时间距离dt
i,j
为dt
i,j
=|j-i|,矩阵单元值 [0051]
步骤4中,时间权重的定义可以选择前后n天定义为邻接,权重设置为1,超过前后n天 的时间定义为非邻接,权重设置为0;也可以采用基于时间距离的权重计算方式。具体实施 时,n可采用经验取值或者相关规定要求的值。
[0052]
步骤5:空间邻接关系的时空扩展。将步骤2中构建的空间邻接矩阵w与步骤4中构建 的时间邻接矩阵t进行克罗内克积运算,对空间邻接矩阵进行时间上的张量扩展,得到空间 时空邻接矩阵wt。矩阵的时空扩展包括时空同生扩展与时空滞后扩展两种方法,参见图4。
[0053]
时空同生扩展只考虑不同时间节点研究单元与其本身之间的关联,而不考虑其在不同时 间节点对其它单元所造成的影响。时空同生扩展矩阵wt
contem
计算公式可表示如下:
[0054][0055]
其中i
t
为时间单位矩阵,矩阵维度与时间邻接矩阵t一致;is为空间单位对角矩阵,矩阵 维度与空间邻接矩阵w一致;为克罗内克积运算符。
[0056]
时空滞后扩展不仅考虑不同时间节点研究单元与其本身之间的关联,也考虑研究单元在 不同时间节点对其它单元所造成的影响。时空滞后扩展矩阵wt
lag
计算公式可表示如下:
[0057][0058]
其中i
t
为时间单位对角矩阵,矩阵维度与时间邻接矩阵t一致;is为空间单位对角矩阵, 矩阵维度与空间邻接矩阵w一致;为克罗内克积运算符。
[0059]
步骤6:人口流动网络邻接关系的时空扩展。将步骤3中对每个时间节点t(t=0,1,2
…
,m) 构建的人口流动网络邻接矩阵f
t
与步骤4中构建的时间邻接矩阵进行克罗内克积运算,得到 人口流动时空邻接矩阵f
t
t。矩阵的时空扩展同样包括步骤5中介绍的时空同生扩展与时空滞 后扩展两种方法。人口流动时空同生扩展矩阵f
t
t
contem
和人口流动时空滞后扩展矩阵f
t
t
lag
计 算公式分别表示如下:
[0060][0061][0062]
其中i
t
为时间单位矩阵,矩阵维度与时间邻接矩阵t一致;is为空间单位对角矩阵,矩阵 维度与人口流动邻接矩阵f
t
一致;为克罗内克积运算符。将所有计算得到的时空人口流动 邻接矩阵f
t
t(t=0,1,2
…
,p)进行求和,得到最终整体人口流动时空邻接矩阵ft。
[0063]
步骤7:时空特征向量的提取与筛选。
[0064]
实施例中,将步骤5和步骤6中得到的时空邻接矩阵wt和ft进行中心化,得到中心化 时空矩阵wct和fct;对中心化后的矩阵计算特征值和特征向量;将特征向量根据预设的阈 值(优选建议为0.25)进行的初筛,并用stepwise方法对初筛后的特征向量进行再次筛选, 最终作为空间时空影响因素和人口流动时空影响因素加入到建模过程中。
[0065]
更进一步的,时空特征向量的提取与筛选包含以下几个步骤:
[0066]
步骤7.1:时空邻接矩阵的中心化。将步骤5和步骤6中的空间时空权重矩阵wt和人口 流动时空权重矩阵ft进行中心化计算,得到中心化后对称的时空矩阵wct和fct。时空邻 接矩阵中心化公式如下:
[0067][0068][0069]
其中,n表示研究区的空间维度,即研究单元的数量,p表示时空建模中的时间维度,在 此研究中即研究天数。i为n
×
p维时空单位矩阵,11
t
为(n
×
p)
×
(n
×
p)维元素全部为1的 矩阵。对称化后
[0070]
步骤7.2:时空特征值与特征向量的计算。分别对步骤7.1中计算得到的中心化时空权重 矩阵wct和fct计算特征值和特征向量,得到wct的特征值集合λ
wct
={λ
w1
,λ
w2
,...,λ
wnp
} 和特征值对应的特征向量集合ev
wct
={ev
w1
,ev
w2
,...,ev
wnp
},特征值集λ
wct
按由大到小排 列,即λ
w1
>λ
w2
>...>λ
wnp
;以及fct的特征值集合λ
fct
={λ
f1
,λ
f2
,...,λ
fnp
}和特征值对应 的特征向量集合ev
fct
={ev
f1
,ev
f2
,...,ev
fnp
},特征值集λ
fct
按由大到小排列,即λ
f1
>λ
f2
> ...>λ
fnp
。其中,n表示研究区的空间维度,即研究单元的数量,p表示时空建模中的时间维 度,在此研究中即研究天数。
[0071]
步骤7.3:时空特征向量的筛选。首先将计算得到的空间时空特征向量和人口流动时空特 征向量进行初步筛选,再对初筛特征向量集采用stepwise方法进行再次筛选,具体步骤如下:
[0072]
步骤7.3.1:特征向量的初步筛选。将步骤7.2中计算得到的特征向量集合ev
wct
和ev
fct
分别进行阈值为0.25的初筛,特征向量对应的特征值需要满足以下两个要求:1.特征值大于 0;2.特征值与集合中最大特征值的比例大于0.25,即λ
wi
/max(λ
wct
)>0.25,λ
fi
/max (λ
fct
)>0.25,其中,i表示特征向量集合中第i个特征值。初筛出的特征向量能够反映出不同 程度的时空聚集特征和人口流动聚集特征,特征值越大,对应特征向量所反映出的聚集性越 强。
[0073]
步骤7.3.2:特征向量stepwise方法筛选。将步骤7.3.1中初筛得到的特征向量进行特征 值由大到小的排列,然后依次分别加入到以新冠感染率为因变量,步骤1中各因子为自变量 的普通最小二乘回归模型中,并计算模型aic值。选择aic值最小的回归模型c1,其对应时 空特征向量为evs,然后将剩余除evs外的时空特征向量依次加入回归模型c1,并计算回归方 程的aic,并判断aic值是否明显减小,若aic值明显减小,则重复上述操作;若aic值几 乎没减小,则停止继续向回归模型中增加时空特征向量,并记录已经加入的时空
特征向量, 这些特征向量即为最终筛选出的最优时空特征向量集ev
finalt
。stepwise方法能够较好筛除未 通过显著性检验的变量,避免不显著变量对建模造成干扰。
[0074]
步骤8:构建基于动态人口流动矩阵时空滤值的新冠疫情回归模型。实施例采用的优选 实现具体步骤如下:
[0075]
步骤8.1:回归模型的建立。将步骤1中筛选出的与新冠疫情传播相关的健康影响因子集 合x={x1,x2,...,x
k1
}与步骤7中stepwise筛选后得到的时空特征向量集合ev
finalt
= {ev
finalt1
,ev
finalt2
,...,ev
finaltk2
}作为自变量,新冠疫情感染率作为因变量ifr,建立回归模 型,公式如下:
[0076][0077]
其中βk健康影响因子集合xk对应的参数,βm为时空特征向量ev
finaltm
对应的参数,ε为 随机误差,满足独立和正态分布的原假设。将后续新时间段的自变量和人口流动情况代入所 得模型,则可以根据健康影响因子的变化和人口流动的变化预测新冠疫情感染率的变化程度。
[0078]
步骤8.2:模型精度评价。选择模型调整后拟合优度adj.r2、均方根误差rmse、极大似 然值aic等统计指标对模型进行精度评价,指标计算公式如下:
[0079][0080][0081][0082]
其中ifr
it
为第i个研究单元在第t时刻的covid-19感染率,以天尺度为例,it=1即为第1个 研究单元在第1天的covid-19实际感染率,为第i个单元在t时刻的预测模型值,为covid-19总平均感染率,df为相应模型的自由度,p为自变量个数,n为研究单元数,t表 示时空建模中的时间维度,在此研究中即研究天数。
[0083]
具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现 自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读 存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。
[0084]
在一些可能的实施例中,提供一种基于动态人口流动矩阵空间滤值的新冠时空建模预测 系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指 令执行如上所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法。
[0085]
在一些可能的实施例中,提供一种基于动态人口流动矩阵空间滤值的新冠时空建
模预测 系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行 时,实现如上所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法。
[0086]
应当理解的是,上述针对本发明中较佳实施例的表述较为详细,但不能因此认为是对本 发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在本发明权利要求保 护范围内,可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围以 所附权利要求书为准。
技术特征:1.一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,其特征在于,包括以下步骤:步骤1,数据获取与处理,包括获取新冠疫情数据及与新冠疫情传播相关的数据,对数据产品进行预处理和筛选,用于后续建模;步骤2,构建空间邻接矩阵,包括根据空间单元的空间邻接关系构建邻接矩阵w,矩阵单元值表示研究单元之间的空间邻接权重;步骤3,构建人口流动网络邻接矩阵,包括获取疫情期间各个时间节点研究单元之间的人口流动数据,根据人口流动的强弱关系,对每一个时间节点t构建对应人口流动网络邻接矩阵f
t
,矩阵单元值表示在时间节点t研究单元之间人口流动交互的强弱;步骤4,构建时间邻接矩阵,包括将一维时间序列扩充为二维邻接矩阵t,矩阵单元值t
ij
对应表示时间节点i与时间节点j之间的时间邻接权重;步骤5,空间邻接关系的时空扩展,包括将步骤2中构建的空间邻接矩阵w与步骤4中构建的时间邻接矩阵进行克罗内克积运算,对空间邻接矩阵进行时间上的张量扩展,得到空间时空邻接矩阵wt,矩阵单元值表示在时间节点t研究单元之间人口流动交互的强弱;步骤6,人口流动网络邻接关系的时空扩展,包括将步骤3中对每个时间节点t构建的人口流动网络邻接矩阵f
t
与步骤4中构建的时间邻接矩阵进行克罗内克积运算,得到人口流动时空邻接矩阵f
t
t;将所有计算得到的时空人口流动邻接矩阵进行求和,得到最终整体人口流动时空邻接矩阵ft;步骤7,时空特征向量的提取与筛选,包括将步骤5和步骤6中得到的时空邻接矩阵wt和ft进行中心化,得到中心化时空矩阵wct和fct;对中心化后的矩阵计算特征值和特征向量;将特征向量根据预设阈值初筛,并用stepwise方法对初筛后的特征向量进行再次筛选,最终作为空间时空影响因素和人口流动时空影响因素加入到建模过程中;步骤8,构建基于动态人口流动矩阵时空滤值的新冠疫情回归模型,包括将步骤1中筛选的数据以及步骤7中筛选出的空间时空特征向量ev
wt
、人口流动时空特征向量ev
ft
作为自变量加入到回归模型中,对新冠疫情数据进行建模预测和评价。2.如权利要求1所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,其特征在于:步骤1中,与新冠疫情传播相关的数据包括但不限于人口密度、人口年龄结构、受教育程度、gdp、人口活动强度、气温、气压、风速、降水和海拔。3.如权利要求1所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,其特征在于:步骤2中,建立空间邻接权重矩阵的方式采用rock邻接,bishop邻接或queen邻接;或者采用基于距离的空间权重方式代替邻接关系。4.如权利要求1所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,其特征在于:步骤3中,不同时间节点的单元人口流动交互特征不同,对研究时间段内的所有时间节点分别构建人口流动网络邻接矩阵f
t
,t=0,1,2
…
,p,p表示时空建模中的时间维度。5.如权利要求1所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,其特征在于:步骤4中,时间权重的定义为,选择前后n天定义为邻接,权重设置为1,超过前后n天的时间定义为非邻接,权重设置为0;或者采用基于时间距离的权重计算方式。6.如权利要求1所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方
法,其特征在于:步骤5和步骤6中,矩阵的时空扩展包括时空同生扩展与时空滞后扩展两种,时空同生扩展只考虑不同时间节点研究单元与其本身之间的关联,而不考虑其在不同时间节点对其它单元所造成的影响;时空滞后扩展不仅考虑不同时间节点研究单元与其本身之间的关联,也考虑研究单元在不同时间节点对其它单元所造成的影响。7.如权利要求1或2或3或4或5或6所述的一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,其特征在于:步骤8中,建模过程包括以下处理,回归模型的建立,包括将步骤1中筛选出的与新冠疫情传播相关的健康影响因子集合x与步骤7中stepwise筛选后得到的时空特征向量集合作为自变量,新冠疫情感染率作为因变量ifr,建立回归模型;模型精度评价,包括选择模型拟合优度、均方根误差和极大似然值统计指标对模型进行精度评价。
技术总结本发明提供一种基于动态人口流动矩阵空间滤值的新冠时空建模预测方法,包括获取新冠疫情数据及与新冠疫情传播相关的数据,对数据产品进行预处理和筛选,用于后续建模;根据空间单元的空间邻接关系构建邻接矩阵,构建人口流动网络邻接矩阵,构建时间邻接矩阵,空间邻接关系的时空扩展,人口流动网络邻接关系的时空扩展,时空特征向量的提取与筛选,构建基于动态人口流动矩阵时空滤值的新冠疫情回归模型,对新冠疫情数据进行建模预测和评价。本发明提高了新冠疫情时空建模的预测准确性,新冠疫情以及其它传染病的自动化分析与防控提供重要参考依据。重要参考依据。重要参考依据。
技术研发人员:陈玉敏 陈娒杰 杨家鑫 周安南 李殿鑫 安钱莹
受保护的技术使用者:武汉大学
技术研发日:2022.04.29
技术公布日:2022/11/1