1.本发明涉及行踪识别技术领域,具体涉及一种基于流调大数据的行踪识别方法。
背景技术:[0002][0003]
社会安全保障工作始于对潜在风险的全面感知,终于对风险苗头的及时防范和有效控制,实质上是一个由数据到决策的转变过程,其中涉及到“由数据到信息”、“由信息到知识”、“由知识到决策”等一系列转变,融合处理和关联分析等更多的是解决数据到信息、信息到知识的转变,而落实到具体决策的关键转变环节即是对风险苗头的预测预警。
[0004]
技术实现要素:[0005]
本发明的目的在于提供一种基于流调大数据的行踪识别方法,以解决现有技术中行踪识别的精度差,时效性低的技术问题。
[0006]
为解决上述技术问题,本发明具体提供下述技术方案:
[0007]
一种基于流调大数据的行踪识别方法,包括以下步骤:
[0008]
步骤s1、对目标区域的每个流调个体设定基础风险度和基础流调频率,并按基础流调频率获取流调个体的流调数据,基于流调数据对流调个体进行流调评估更新流调个体的风险度,以及基于流调个体的风险度更新流调个体的流调频率;
[0009]
步骤s2、将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,并对具有识别标签的流调个体进行流调数据时序序列获取;
[0010]
步骤s3、利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性。
[0011]
作为本发明的一种优选方案,所述对目标区域的每个流调个体设定基础风险度和基础流调频率,并按基础流调频率获取流调个体的流调数据,包括:
[0012]
将流调时序区间的初始流调时序作为第1流调时序,将在第1流调时序 t1处位于目标区域内的人员个体标记为流调个体,并在所述第1流调时序t1处为流调个体设定基础风险度d
i,1
和基础流调频率freq
i,1
,以及在第1流调时序t1处获得每个流调个体的流调数据x
i,1
,其中,d
i,1
为第i个流调个体在第1 流调时序t1处的基础风险度,freq
i,1
为第i个流调个体在第1流调时序t1处的基础流调频率;
[0013]
根据所述流调个体的基础流调频率freq
i,1
得到获得每个流调个体的第2流调时序t
i,2
=t1+1/freq
i,1
,获取每个流调个体的在流调时序t
i,2
处的流调数据x
i,2
,其中,t
i,2
为第i个流调个体的第2流调时序,i为计量常数。
[0014]
作为本发明的一种优选方案,所述基于流调数据对流调个体进行流调评估更新流调个体的风险度,包括:
[0015]
对流调个体在第r流调时序t
i,r
处的流调数据x
i,r
和第r+1流调时序t
i,r+1
处的流调
数据x
i,r+1
进行数据相似度量化,并基于流调数据x
i,r
和流调数据x
i,r+1
的数据相似度更新流调个体在第r+1流调时序t
i,r+1
处的风险度,所述风险度的计算公式为:
[0016]di,r+1
=d
i,r
(200%-p
i,r+1,r
);
[0017]
所述数据相似度的计算公式为:
[0018][0019]
式中,d
i,r+1
为第i流调个体在第r+1流调时序t
i,r+1
处的风险度,d
i,r
为第i 流调个体在第r流调时序t
i,r
处的风险度,p
i,r+1,r
为第i流调个体的流调数据x
i,r
和流调数据x
i,r+1
的数据相似度,x
i,r
为第i流调个体在的第r流调时序t
i,r
处的流调数据,x
i,r+1
为第i流调个体在的第r+1流调时序t
i,r+1
处的流调数据,t
i,r+1
为第i流调个体在第r+1流调时序,t
i,r
为第i流调个体在第r流调时序,r为计量常数,r≥1,t为转置运算符。
[0020]
作为本发明的一种优选方案,所述基于流调个体的风险度更新流调个体的流调频率,包括:
[0021]
将流调个体在第r+1流调时序t
i,r+1
处的风险度d
i,r+1
与风险阈值进行比较,其中,
[0022]
若风险度d
i,r+1
小于风险阈值,则更新流调个体在第r+1流调时序t
i,r+1
处的流调频率freq
i,r+1
=freq
i,r
;
[0023]
若风险度d
i,r+1
大于或等于风险阈值,则更新流调个体在第r+1流调时序 t
i,r+1
处的流调频率freq
i,r+1
更新为
[0024]
式中,freq
i,r+1
为第i流调个体在第r+1流调时序处的流调频率,freq
i,r
为第i流调个体在第r流调时序处的流调频率。
[0025]
作为本发明的一种优选方案,所述将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,包括:
[0026]
将风险度d
i,r+1
大于或等于风险阈值的流调个体标记为高风险度的流调个体,并将高风险度的流调个体在第r+1流调时序处赋予识别标签。
[0027]
作为本发明的一种优选方案,所述对具有识别标签的流调个体进行流调数据时序序列获取,包括:
[0028]
将对具有识别标签的流调个体获取位于第r+1流调时序的前置流调时序处的流调数据,并将所述前置流调时序处的流调数据依据时序进行排序得到所述流调数据时序序列lj={x
j,1
,
…
,x
j,r+1
},其中,lj为具有识别标签的第j个流调个体的流调数据时序序列,x
j,1
为具有识别标签的第j个流调个体在第1 流调时序处的流调数据,x
j,r+1
为具有识别标签的第j个流调个体在第r+1流调时序处的流调数据。
[0029]
作为本发明的一种优选方案,所述利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性,包括:
[0030]
将流调数据时序序列lj输入至行踪风险识别网络,并由行踪风险识别模型输出流调个体的行踪风险性;
[0031]
所述行踪风险识别网络的构建包括:
[0032]
获取一组流调个体的流调数据时序序列作为样例序列,并标记每个样例序列的行踪风险性;
[0033]
将样例序列作为cnn神经网络的输入项,以及行踪风险性作为cnn神经网络的输出项,将cnn神经网络基于所述输入项和所述输出项进行网络训练得到所述行踪风险识别模型;
[0034]
所述行踪风险性的类别标签包括行踪有风险和行踪无风险。
[0035]
作为本发明的一种优选方案,所述流调数据在进行运算前,对流调数据中各个数据分量进行归一化处理。
[0036]
作为本发明的一种优选方案,在标记为行踪有风险的流调个体的流调数据时序序列中最大时序位于流调时序区间内,在流调数据时序序列中最大时序的后置时序以所述最大时序处的流调频率持续进行流调数据监测,直至行踪有风险的流调个体行踪被限制的时序处为止。
[0037]
作为本发明的一种优选方案,在标记为行踪无风险的流调个体的流调数据时序序列中最大时序等于流调时序区间的终止流调时序,对对应的行踪无风险的流调个体在终止流调时序处终止流调数据监测;
[0038]
对流调时序区间中所有流调时序处均未获得识别标签的流调个体在终止流调时序处终止流调数据监测。
[0039]
本发明与现有技术相比较具有如下有益效果:
[0040]
本发明设定风险度在流调时序区间中进行风险监测,以及作为调整流调个体流调频率的基准值,实现对流调个体进行个性化行踪识别,对高风险的流调个体设定高流调频率,以及对低风险的流调个体设定低流调频率,避免流调数据冗余或不足,而且还设置行踪风险识别网络对高风险的流调个体进行行踪风险性的确定,提高了行踪风险性的识别效率和精度。
附图说明
[0041]
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0042]
图1为本发明实施例提供的行踪识别方法流程图。
具体实施方式
[0043]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
如图1所示,本发明提供了一种基于流调大数据的行踪识别方法,包括以下步骤:
[0045]
步骤s1、对目标区域的每个流调个体设定基础风险度和基础流调频率,并按基础流调频率获取流调个体的流调数据,基于流调数据对流调个体进行流调评估更新流调个体的风险度,以及基于流调个体的风险度更新流调个体的流调频率;流调数据包括交通行程数据:出行工具,出行途径地点,出行时间,出行频率等,区域流行病封控等级,接触人员结
构等,交通行程数据来自于交通执管部门。
[0046]
对目标区域的每个流调个体设定基础风险度和基础流调频率,并按基础流调频率获取流调个体的流调数据,包括:
[0047]
将流调时序区间的初始流调时序作为第1流调时序,将在第1流调时序 t1处位于目标区域内的人员个体标记为流调个体,并在第1流调时序t1处为流调个体设定基础风险度d
i,1
和基础流调频率freq
i,1
,以及在第1流调时序t1处获得每个流调个体的流调数据x
i,1
,其中,d
i,1
为第i个流调个体在第1流调时序t1处的基础风险度,freq
i,1
为第i个流调个体在第1流调时序t1处的基础流调频率,基础风险度可依据目标区域的流行病封控等级进行设定;
[0048]
根据流调个体的基础流调频率freq
i,1
得到获得每个流调个体的第2流调时序t
i,2
=t1+1/freq
i,1
,获取每个流调个体的在流调时序t
i,2
处的流调数据x
i,2
,其中,t
i,2
为第i个流调个体的第2流调时序,i为计量常数。
[0049]
基于流调数据对流调个体进行流调评估更新流调个体的风险度,包括:
[0050]
对流调个体在第r流调时序t
i,r
处的流调数据x
i,r
和第r+1流调时序t
i,r+1
处的流调数据x
i,r+1
进行数据相似度量化,并基于流调数据x
i,r
和流调数据x
i,r+1
的数据相似度更新流调个体在第r+1流调时序t
i,r+1
处的风险度,风险度的计算公式为:
[0051]di,r+1
=d
i,r
(200%-p
i,r+1,r
);
[0052]
数据相似度的计算公式为:
[0053][0054]
式中,d
i,r+1
为第i流调个体在第r+1流调时序t
i,r+1
处的风险度,d
i,r
为第i 流调个体在第r流调时序t
i,r
处的风险度,p
i,r+1,r
为第i流调个体的流调数据x
i,r
和流调数据x
i,r+1
的数据相似度,x
i,r
为第i流调个体在的第r流调时序t
i,r
处的流调数据,x
i,r+1
为第i流调个体在的第r+1流调时序t
i,r+1
处的流调数据,t
i,r+1
为第i流调个体在第r+1流调时序,t
i,r
为第i流调个体在第r流调时序,r为计量常数,r≥1,t为转置运算符。
[0055]
基于流调个体的风险度更新流调个体的流调频率,包括:
[0056]
将流调个体在第r+1流调时序t
i,r+1
处的风险度d
i,r+1
与风险阈值进行比较,其中,
[0057]
若风险度d
i,r+1
小于风险阈值,则更新流调个体在第r+1流调时序t
i,r+1
处的流调频率freq
i,r+1
=freq
i,r
;
[0058]
若风险度d
i,r+1
大于或等于风险阈值,则更新流调个体在第r+1流调时序 t
i,r+1
处的流调频率freq
i,r+1
更新为
[0059]
式中,freq
i,r+1
为第i流调个体在第r+1流调时序处的流调频率,freq
i,r
为第i流调个体在第r流调时序处的流调频率。
[0060]
依次基于流调频率获得后置的流调时序,流调个体的风险度发生提高时,则流调个体的行踪变动程度越高,即该流调个体越值得被关注,因此此时将流调个体的流调频率进行提高,对该流调个体进行高频流调,从而获得更多该流调个体的行踪行程细节,并且能够提高标记高风险度流调个体的时效性,进而对后续行踪识别提供包含更多行踪行程细节的流调数据时序序列,提高行踪识别准确性。
[0061]
流调个体的风险度未发生提高时,则流调个体的行踪变动程度越低,即该流调个体越不值得被关注,因此此时将流调个体的流调频率维持在前置时序的流调频率上,对该流调个体按基础流调频率进行流调,无需更多的获取行踪行程细节,按基础基础流调频率获得的流调数据量已能满足时效性需要,过高频率的流调只会导致该流调个体出现数据冗余,造成流调资源的浪费。
[0062]
步骤s2、将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,并对具有识别标签的流调个体进行流调数据时序序列获取;
[0063]
将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,包括:
[0064]
将风险度d
i,r+1
大于或等于风险阈值的流调个体标记为高风险度的流调个体,并将高风险度的流调个体在第r+1流调时序处赋予识别标签。
[0065]
对具有识别标签的流调个体进行流调数据时序序列获取,包括:
[0066]
将对具有识别标签的流调个体获取位于第r+1流调时序的前置流调时序处的流调数据,并将前置流调时序处的流调数据依据时序进行排序得到流调数据时序序列lj={x
j,1
,
…
,x
j,r+1
},其中,lj为具有识别标签的第j个流调个体的流调数据时序序列,x
j,1
为具有识别标签的第j个流调个体在第1流调时序处的流调数据,x
j,r+1
为具有识别标签的第j个流调个体在第r+1流调时序处的流调数据,j为计量常数。
[0067]
步骤s3、利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性。
[0068]
利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性,包括:
[0069]
将流调数据时序序列lj输入至行踪风险识别网络,并由行踪风险识别模型输出流调个体的行踪风险性;
[0070]
行踪风险识别网络的构建包括:
[0071]
获取一组流调个体的流调数据时序序列作为样例序列,并标记每个样例序列的行踪风险性;
[0072]
将样例序列作为cnn神经网络的输入项,以及行踪风险性作为cnn神经网络的输出项,将cnn神经网络基于输入项和输出项进行网络训练得到行踪风险识别模型;
[0073]
行踪风险性的类别标签包括行踪有风险和行踪无风险。
[0074]
利用行踪风险识别网络能够对行踪风险性与流调数据时序序列间的关联性进行算法提取,最终形成模型网络投入使用,可有效的降低人工识别的工作量和主观性。
[0075]
流调数据在进行运算前,对流调数据中各个数据分量进行归一化处理。
[0076]
在标记为行踪有风险的流调个体的流调数据时序序列中最大时序位于流调时序区间内,在流调数据时序序列中最大时序的后置时序以最大时序处的流调频率持续进行流调数据监测,直至行踪有风险的流调个体行踪被限制的时序处为止,即对行踪有风险的流调个体流调不再限制于流调时序区间内,在对流调个体进行行踪限制前都需要进行流调数据的获取,从而能够全部的掌握住行踪有风险的流调个体的行踪行程信息,以供后续追溯使用,行踪限制是交通执管部门为了避免行踪有风险的流调个体造成更多的流行病传播等现象。
[0077]
在标记为行踪无风险的流调个体的流调数据时序序列中最大时序等于流调时序区间的终止流调时序,对对应的行踪无风险的流调个体在终止流调时序处终止流调数据监测;
[0078]
对流调时序区间中所有流调时序处均未获得识别标签的流调个体在终止流调时序处终止流调数据监测。
[0079]
本发明设定风险度在流调时序区间中进行风险监测,以及作为调整流调个体流调频率的基准值,实现对流调个体进行个性化行踪识别,对高风险的流调个体设定高流调频率,以及对低风险的流调个体设定低流调频率,避免流调数据冗余或不足,而且还设置行踪风险识别网络对高风险的流调个体进行行踪风险性的确定,提高了行踪风险性的识别效率和精度。
[0080]
以上实施例仅为本技术的示例性实施例,不用于限制本技术,本技术的保护范围由权利要求书限定。本领域技术人员可以在本技术的实质和保护范围内,对本技术做出各种修改或等同替换,这种修改或等同替换也应视为落在本技术的保护范围内。
技术特征:1.一种基于流调大数据的行踪识别方法,其特征在于,包括以下步骤:步骤s1、对目标区域的每个流调个体设定基础风险度和基础流调频率,并按基础流调频率获取流调个体的流调数据,基于流调数据对流调个体进行流调评估更新流调个体的风险度,以及基于流调个体的风险度更新流调个体的流调频率;步骤s2、将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,并对具有识别标签的流调个体进行流调数据时序序列获取;步骤s3、利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性。2.根据权利要求1所述的一种基于流调大数据的行踪识别方法,其特征在于:所述对目标区域的每个流调个体设定基础风险度和基础流调频率,并按基础流调频率获取流调个体的流调数据,包括:将流调时序区间的初始流调时序作为第1流调时序,将在第1流调时序t1处位于目标区域内的人员个体标记为流调个体,并在所述第1流调时序t1处为流调个体设定基础风险度d
i,1
和基础流调频率freq
i,1
,以及在第1流调时序t1处获得每个流调个体的流调数据x
i,1
,其中,d
i,1
为第i个流调个体在第1流调时序t1处的基础风险度,freq
i,1
为第i个流调个体在第1流调时序t1处的基础流调频率;根据所述流调个体的基础流调频率freq
i,1
得到获得每个流调个体的第2流调时序t
i,2
=t1+1/freq
i,1
,获取每个流调个体的在流调时序t
i,2
处的流调数据x
i,2
,其中,t
i,2
为第i个流调个体的第2流调时序,i为计量常数。3.根据权利要求2所述的一种基于流调大数据的行踪识别方法,其特征在于:所述基于流调数据对流调个体进行流调评估更新流调个体的风险度,包括:对流调个体在第r流调时序t
i,r
处的流调数据x
i,r
和第r+1流调时序t
i,r+1
处的流调数据x
i,r+1
进行数据相似度量化,并基于流调数据x
i,r
和流调数据x
i,r+1
的数据相似度更新流调个体在第r+1流调时序t
i,r+1
处的风险度,所述风险度的计算公式为:d
i,r+1
=d
i,r
(200%-p
i,r+1,r
);所述数据相似度的计算公式为:式中,d
i,r+1
为第i流调个体在第r+1流调时序t
i,r+1
处的风险度,d
i,r
为第i流调个体在第r流调时序t
i,r
处的风险度,p
i,r+1,r
为第i流调个体的流调数据x
i,r
和流调数据x
i,r+1
的数据相似度,x
i,r
为第i流调个体在的第r流调时序t
i,r
处的流调数据,x
i,r+1
为第i流调个体在的第r+1流调时序t
i,r+1
处的流调数据,t
i,r+1
为第i流调个体在第r+1流调时序,t
i,r
为第i流调个体在第r流调时序,r为计量常数,r≥1,t为转置运算符。4.根据权利要求3所述的一种基于流调大数据的行踪识别方法,其特征在于:所述基于流调个体的风险度更新流调个体的流调频率,包括:将流调个体在第r+1流调时序t
i,r+1
处的风险度d
i,r+1
与风险阈值进行比较,其中,若风险度d
i,r+1
小于风险阈值,则更新流调个体在第r+1流调时序t
i,r+1
处的流调频率freq
i,r+1
=freq
i,r
;
若风险度d
i,r+1
大于或等于风险阈值,则更新流调个体在第r+1流调时序t
i,r+1
处的流调频率freq
i,r+1
更新为式中,freq
i,r+1
为第i流调个体在第r+1流调时序处的流调频率,freq
i,r
为第i流调个体在第r流调时序处的流调频率。5.根据权利要求4所述的一种基于流调大数据的行踪识别方法,其特征在于:所述将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,包括:将风险度d
i,r+1
大于或等于风险阈值的流调个体标记为高风险度的流调个体,并将高风险度的流调个体在第r+1流调时序处赋予识别标签。6.根据权利要求5所述的一种基于流调大数据的行踪识别方法,其特征在于:所述对具有识别标签的流调个体进行流调数据时序序列获取,包括:将对具有识别标签的流调个体获取位于第r+1流调时序的前置流调时序处的流调数据,并将所述前置流调时序处的流调数据依据时序进行排序得到所述流调数据时序序列l
j
={x
j,1
,
…
,x
j,r+1
},其中,l
j
为具有识别标签的第j个流调个体的流调数据时序序列,x
j,1
为具有识别标签的第j个流调个体在第1流调时序处的流调数据,x
j,r+1
为具有识别标签的第j个流调个体在第r+1流调时序处的流调数据。7.根据权利要求6所述的一种基于流调大数据的行踪识别方法,其特征在于,所述利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性,包括:将流调数据时序序列l
j
输入至行踪风险识别网络,并由行踪风险识别模型输出流调个体的行踪风险性;所述行踪风险识别网络的构建包括:获取一组流调个体的流调数据时序序列作为样例序列,并标记每个样例序列的行踪风险性;将样例序列作为cnn神经网络的输入项,以及行踪风险性作为cnn神经网络的输出项,将cnn神经网络基于所述输入项和所述输出项进行网络训练得到所述行踪风险识别模型;所述行踪风险性的类别标签包括行踪有风险和行踪无风险。8.根据权利要求7所述的一种基于流调大数据的行踪识别方法,其特征在于,所述流调数据在进行运算前,对流调数据中各个数据分量进行归一化处理。9.根据权利要求8所述的一种基于流调大数据的行踪识别方法,其特征在于,在标记为行踪有风险的流调个体的流调数据时序序列中最大时序位于流调时序区间内,在流调数据时序序列中最大时序的后置时序以所述最大时序处的流调频率持续进行流调数据监测,直至行踪有风险的流调个体行踪被限制的时序处为止。10.根据权利要求9所述的一种基于流调大数据的行踪识别方法,其特征在于,在标记为行踪无风险的流调个体的流调数据时序序列中最大时序等于流调时序区间的终止流调时序,对对应的行踪无风险的流调个体在终止流调时序处终止流调数据监测;对流调时序区间中所有流调时序处均未获得识别标签的流调个体在终止流调时序处终止流调数据监测。
技术总结本发明公开了一种基于流调大数据的行踪识别方法,包括以下步骤:步骤S1、基于流调数据对流调个体进行流调评估更新流调个体的风险度,以及基于流调个体的风险度更新流调个体的流调频率;步骤S2、将流调个体的风险度进行阈值标签化以对高风险度的流调个体赋予识别标签,并对具有识别标签的流调个体进行流调数据时序序列获取;步骤S3、利用预先建立的行踪风险识别网络基于流调数据时序序列判定出具有识别标签的流调个体的行踪风险性。本发明实现对流调个体进行个性化行踪识别,对高风险的流调个体设定高流调频率,提高了行踪风险性的识别效率和精度。别效率和精度。别效率和精度。
技术研发人员:杨永 魏益民 刘昕林 韩勇
受保护的技术使用者:宝鸡市交通信息工程研究所
技术研发日:2022.07.15
技术公布日:2022/11/1