一种基于大数据的重点人员异常行为预测方法及装置
1.技术领域
2.本发明涉及互联网大数据领域,尤其涉及一种基于大数据的重点人员异常行为预测方法及装置。
背景技术:3.对重点人员进行管理,可以提前预防、发现和打击违法行为,消除社会治安隐患。建立有效的重点人员风险管理体制,能够有效维护社会稳定。
4.基于业务规则对获取的信息进行评估,借助专家经验来判断该人员是否列管或撤管。目前,已经发展到基于大数据、专家经验和机器学习算法建立重点人口风险评估系统来识别重点人员。现有技术中,主要通过录入重点人员身份信息、通过访谈等手段采集重点人员日常行为数据,利用大数据挖掘发现风险要素,并结合业务规则和专家经验的评分系统评估重点人员的风险系数。但目前的做法仍然难以适应和及时发现不断升级的人员异常行为。
5.近年来,随着人脸识别技术的快速发展以及基于人像特征值聚类技术的不断成熟,如何结合人像大数据系统,城市的生活、轨迹等大数据,对重点人员的行为模式进行分析以及对其行为带来的风险性作出评估成为本发明要解决的问题。
技术实现要素:6.有鉴于此,本发明实施例提供一种基于大数据的重点人员异常行为预测方法及装置,能够解决现有技术针对不断升级的人员异常行为难以进行有效分析和评估的问题。
7.第一方面,本发明实施例提供一种基于大数据的重点人员异常行为预测方法,包括 :获取目标信息数据,并基于所述目标信息数据构建异常行为发现的指标体系;根据所述目标信息数据和所述异常行为发现的指标体系,通过大数据关联碰撞获得指标体系数据;基于所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型;根据待测人员的信息数据以及所述异常行为发现模型获得对所述待测人员的行为类别的预测结果。
8.上述目标信息数据包括人员基本信息数据、出入特定地点的人像数据、消费信息数据、交通出行数据、生活缴费数据、行为异常数据。
9.上述异常行为发现的指标体系为两级指标体系,所述构建异常行为发现的指标体系具体为:通过对所述目标信息数据的类别分析建立设预设个数的一级指标,以及为各个一级指标下设二级指标。
10.上述一级指标包括生活轨迹指标、出行轨迹指标、基本信息指标、行为异常指标。
11.优选地,所述方法还包括获取重点人员的第一大数据信息,进行第一异常行为发现分析;以及获取重点人员的第二大数据信息进行第二异常行为发现分析,将两次分析的分析结果作为参考依据获取所述目标信息数据以及构建异常行为发现的指标体系。
12.优选地,所述基于所述指标数据,利用主成分分析方法和朴素贝叶斯算法构建异常行为发现模型具体为:运用主成分分析方法对所述指标体系数据进行降维处理,基于降维处理后得到的数据,采用朴素贝叶斯算法训练得到异常行为发现模型,并对所述异常行为发现模型进行检验评估和自动学习优化。所述检验评估具体为,利用验证样本数据对异常行为发现模型进行检验、评估和优化;所述自动学习优化具体为,基于新增的目标信息数据,自动优化模型。
13.第二方面,本发明实施例提供一种基于大数据的重点人员异常行为预测装置,包括大数据获取模块、指标体系构建模块、指标体系数据产生模块、模型训练模块和预测结果输出模块;所述大数据获取模块,用于获取目标信息数据;所述指标体系构建模块,用于基于所述大数据获取模块获取的所述目标信息数据构建异常行为发现的指标体系;所述指标体系数据产生模块,用于根据所述目标信息数据和所述异常行为发现的指标体系,通过大数据关联碰撞获得指标体系数据;所述模型训练模块,用于基于所述指标体系数据产生模块所产生的所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型;所述预测结果输出模块,用于根据待测人员信息数据得到所述异常行为发现模型的输入,以及根据所述异常行为发现模型的输出获得对所述待测人员的行为类别的预测结果。
14.与现有技术相比,本发明的有益效果在于:1)本发明从大数据多源多视角研究重点人员行为模式,提高了重点人员风险评估的效率与准确性。
15.2)本发明基于城市布控场景,提出了基于大数据,针对重点人员关联重点关注区域进行危险异常分析,针对重点人员进行行为异常发现分析,构建重点人员异常行为发现的指标体系。相较传统的处理方法,业务性更高,数据范围广,能够更快速高效地对异常发现行为数据进行融合。
16.3)本发明结合使用了主成分分析方法和朴素贝叶斯算法,兼顾了异常行为风险概率评分的稳定性、准确度和可解释性,对重点人员的管控具有很好的效果,大大节约了人力。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
18.图1为本发明实施例一的一种基于大数据的重点人员异常行为预测方法流程图;图2为本发明实施例一的目标信息数据的获取方式示意图;图3为本发明实施例一的一种基于大数据的重点人员异常行为预测装置的组成示意图。
具体实施方式
19.下面结合附图对本发明实施例进行详细描述。应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
20.实施例一本实施例提供的一种基于大数据的重点人员异常行为预测方法,如图1所示,包括以下步骤:步骤s1:获取目标信息数据;具体的,获取的目标信息数据包括人员基本信息数据、出入特定地点的人像数据、消费信息数据、交通出行数据、生活缴费数据、行为异常数据等。
21.本发明从大数据多源多视角研究重点人员行为模式,提高了重点人员风险评估的效率与准确性。
22.例如,本实施例中获取的目标信息数据具体包括:人员基本信息数据、行政区划数据、人员从业数据、小区人像点位数据、小区门禁人像数据、话单信息、银行卡消费信息、娱乐场所信息、旅馆住宿信息、水电气缴费信息、铁路信息、客运信息、卡口数据、高速收费站信息、民航信息、共享单车、公交信息、接警信息、处警信息、报警信息、案件信息等。
23.进一步的,在步骤s1之前还可以包括,如图2所示的获取重点人员的第一大数据信息,进行第一异常行为发现分析101;以及获取重点人员的第二大数据信息进行第二异常行为发现分析102,将进行的两次分析的分析结果作为参考获取目标信息数据以及构建异常行为发现的指标体系。具体的,所述第一异常行为发现分析具体为重点人员关联重点区域危险异常分析,所述第二异常行为发现分析具体为重点人员异常行为发现分析。
24.例如,以应用于公安系统为例,则重点人员可以以盗窃前科人员为例,获取重点人员的第一大数据信息,进行第一异常行为发现分析可以具体如下:1.获取盗窃前科人员的信息数据,包含:人员出生日期、性别、涉案事件记录、盘问记录、访谈记录、住店记录、案件数据、案件嫌疑人数据、行政区划数据、网吧上网数据、卡口数据、高速收费站数据等;2.分析盗窃前科人员关联的重点区域的重点人员分布时间变化;以月为单位,统计各月盗窃前科人员现住址所在街道人员数及变动数。
25.3.根据不同类型盗窃前科人员、发生地点、案件类型多维度展示关联的重点区域来源分布情况;通过案件数据、行政区域数据数据碰撞,得出入室盗窃人员、电动车盗窃等盗窃人员关联重点区域的盗窃人员分布情况;通过案件数据、行政区域数据数据碰撞,得出入室盗窃等盗案件关联重点区域的盗窃类案件分布情况;
4.根据不同类型盗窃类型人员关联的重点区域,结合网吧上网、出租屋数据等,展示重点区域重点人员的聚集态势;通过案件数据、行政区域数据、网吧上网、出租屋数据等关联碰撞,得出盗窃人员在一周内在重点区域中的网吧、出租屋内等地点聚集出现人数是否超过两个人,根据连续几周的数据进行比对,判定是否有聚集态势;5.根据不同类型盗窃前科人员关联的重点区域,分析重点区域重点人员的出行频次;通过案件数据、行政区域数据、卡口数据、高速收费站数据等关联碰撞,得出盗窃人员在一周内在重点区域中的出行频次。
26.同理,以重点人员为盗窃前科人员为例,获取盗窃前科人员的第二大数据信息,进行第二异常行为发现分析可以具体如下:1.获取盗窃前科人员的信息数据,包含:案件数据、案件嫌疑人数据、行政区划数据、人员从业数据、小区人像点位数据、小区门禁人像数据等;2.分析各行业中的盗窃前科人员从业情况,得出重点人员从业行业变化;通过案件数据、案件嫌疑人数据、行政区划数据、人员从业数据等关联碰撞,得出盗窃前科人员的从事行业;根据历史数据对比判定从业行业的变化。
27.3.分析各小区的人像点位数据和门禁数据,得出重点人员昼伏夜出和早出晚归情况;判定晚上8点出去及第二天凌晨6点前归来为昼伏夜出行为;判定早上6点前出去及当天晚上8点后归来为早出晚归行为;通过案件嫌疑人数据、行政区划数据、小区的人像点位数据和门禁数据关联碰撞分析,统计最近一个月盗窃前科人员昼伏夜出行为次数和早出晚归行为次数。
28.由此可见,步骤s1可以具体为依据上述第一异常行为发现分析和第二异常行为发现分析得到的重点区域的重点人员分布时间变化、重点区域来源分布情况、重点区域重点人员的聚集态势、重点区域重点人员的出行频次、重点人员从业行业变化、重点人员昼伏夜出和早出晚归情况等分析结果作为参考来获取目标信息数据。
29.例如,重点区域的重点人员分布时间变化与重点区域来源分布情况宏观展示了重点人员的分布情况和重点区域的关注等级,并进一步比较了各重点区域之间的差异,该差异可能是是区域经济因素、警力因素、居住环境因素等原因造成,因为商业区、住宅区、工业区、休闲场所等区域的重点人员情况可能会不一样,跟生活情况息息相关。基于此可以用于确定要获取的目标信息数据可以包括生活相关信息比如出入特定地点的人像数据、消费信息数据、生活缴费数据。
30.重点区域重点人员的聚集态势与重点区域重点人员的出行频次分析,从人像监控、火车、公交、共享单车等等多个方面去挖掘出重点人员的轨迹,可能会分析出多个重点人员同时空出现交集,某些重点人员某个时点频繁乘坐某个交通工具,不同人员也不一样,这些特征跟出行轨迹信息密切相关。基于此可以用于确定要获取的目标信息数据可以包括交通出行数据。
31.重点人员从业行业变化、重点人员昼伏夜出和早出晚归情况等分析挖掘出了人员
基本信息和行为方面的关联情况,可能会发现某些重点人员爱早出晚归,某些夜班人员会昼伏夜出行为比较多,通过这些挖掘分析,重点人员的异常行为特征就比较清晰了。基于此可以用于确定要获取的目标信息数据可以包括人员基本信息数据以及行为异常数据。例如,行为异常数据可具体指涉案信息数据。
32.步骤s2:基于所述目标信息数据,构建异常行为发现的指标体系;所述指标体系包含至少两级指标,即一级指标和隶属于一级指标下的二级指标;本实施例中以构建两级指标体系为例介绍,具体的可以根据获取的目标信息数据的实际情况构建指标体系,构建两级指标体系可以具体为:通过对目标信息数据的类别分析建立设预设个数的一级指标,以及为各个一级指标下设若干个二级指标,关于一级指标和二级指标的个数的设置可以根据实际需要进行调整。
33.或者是,具体为依据前述第一异常行为发现分析和第二异常行为发现分析的分析结果来构建异常行为发现的指标体系。例如,根据第一异常行为发现分析确定的目标信息数据包括生活相关信息、交通出行数据,基于此确定构建的一级指标包括生活轨迹指标、出行轨迹指标,根据第二异常行为发现分析确定的目标信息数据包括人员基本信息数据、行为异常数据,基于此确定构建的一级指标还包括基本信息指标、行为异常指标。
34.例如,构建四个一级指标:生活轨迹指标、出行轨迹指标、基本信息指标、行为异常指标,以及为各个一级指标建立二级指标可以具体如下:(1)建立一级指标:生活轨迹指标;具体的,通过对获取的目标信息数据的类别分析,可以将其中的水电气缴费信息、话单信息、银行卡消费信息、娱乐场所信息、旅馆住宿信息、小区人像点位数据、小区门禁人像数据划分为生活轨迹指标数据,通过对生活轨迹指标数据的统计分析,例如以时间月度为单位进行统计分析,可以得出“月度水电费”“月度电话费”、“月底呼叫和接听次数”、“月度银行消费总额”、“月度娱乐场所出现次数”、“月度旅馆住宿次数”、“月度昼伏夜出次数”、“月度早出晚归次数”等生活轨迹月度分析结果,进而依据上述月度分析结果的类别建立二级指标。
35.即本步骤中在一级指标即生活轨迹指标下所建立的二级指标包括“月度水电费”“月度电话费”、“月底呼叫和接听次数”、“月度银行消费总额”、“月度娱乐场所出现次数”、“月度旅馆住宿次数”、“月度昼伏夜出次数”、“月度早出晚归次数”。
36.(2)建立一级指标:出行轨迹指标;具体的,通过对获取的目标信息数据的类别分析,可以将其中的铁路信息、客运信息、卡口数据、高速收费站信息、民航信息、共享单车、公交信息等数据划分为出行轨迹指标数据,通过对出行轨迹指标数据的统计分析,例如以时间月度为单位进行统计分析,可以得出“月铁路出行次数”、“月铁路出行消费总额”“月客运出行次数”、“月客运出行消费总额”、“关键卡口月出现次数”、“高速月出行次数”、“月民航出行次数”、“月公交出行次数”、“月共享单车出行次数”、“月民航出行消费总额”、“月公交出行消费总额”、“月共享单车出行消费总额”等出行轨迹月度分析结果,进而依据上述月度分析结果的类别建立二级指标。
37.即本步骤中在一级指标即出行轨迹指标下所建立的二级指标可以包括“月铁路出行次数”、“月铁路出行消费总额”“月客运出行次数”、“月客运出行消费总额”、“关键卡口月出现次数”、“高速月出行次数”、“月民航出行次数”、“月公交出行次数”、“月共享单车出行
次数”、“月民航出行消费总额”、“月公交出行消费总额”、“月共享单车出行消费总额”。
38.(3)建立一级指标:基本信息指标;具体的,通过对获取的目标信息数据的类别分析,可以将其中的人员基本信息数据、人员从业信息数据划分为基本信息指标数据,通过对基本信息指标数据的统计分析,可以得出“性别”、“年龄”“婚姻情况”、“家庭人数”、“有无工作”、“工资收入”等基本信息分析结果,进而依据上述基本信息分析结果的类别建立二级指标。
39.即本步骤中在一级指标即基本信息指标下所建立的二级指标可以包括“性别”、“年龄”“婚姻情况”、“家庭人数”、“有无工作”、“工资收入”。
40.(4)建立一级指标:行为异常指标;具体的,通过对获取的目标信息数据的类别分析,可以将其中的接警信息、处警信息、报警信息、案件信息等数据划分为行为异常指标数据,通过对行为异常指标数据的统计分析,可得到“接处警次数”“涉案次数”“涉案金额”等涉警情况分析结果,进而依据上述涉警情况分析结果的类别建立二级指标;即本步骤中在一级指标即行为异常指标下所建立的二级指标可以包括“接处警次数”“涉案次数”“涉案金额”。
41.本发明基于城市布控场景,提出了基于大数据针对重点人员关联重点关注区域进行危险异常分析,针对重点人员进行行为异常发现分析,基于分析结果获取合适的目标信息数据以及构建重点人员异常行为发现的指标体系。相较传统的处理方法,业务性更高,数据范围广,能够更快速高效地对异常发现行为数据进行融合。
42.步骤s3:根据所述目标信息数据和所述指标体系,通过大数据关联碰撞获得指标体系数据。
43.步骤s4:基于所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型;本步骤可具体包括步骤s41和步骤s42;步骤s41:运用主成分分析法对所述指标体系数据进行降维处理;这里的主成分分析法(英文:principal component analysis,简称:pca),是一种统计方法,该方法可以通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分,或者是根据实际需要从中可以取出几个较少的变量尽可能多地反映原来变量的信息,这种统计方法叫做主成分分析或称主分量分析。主成分分析是一种无参的降维算法,使用简单,能够有效解决数据冗余、数据噪声等问题,所以被广泛用于机器学习领域。
44.运用主成分分析方法对指标数据进行降维处理的过程具体如下:1.对样本数据进行标准化处理得到标准化指标;设表示训练样本的样本数据即所述指标数据的个数是n;指标数据,用一个m维特征向量来描述m个属性的值,即,其中1≤i≤n,1≤j≤m,n>m。
45.对各个指标数据根据公式(1)进行标准变换得到标准化矩阵z:
ꢀ
(1)其中,i =1,2,......n;j=1,2,......m;在公式(1)中,=1,2,......n;j=1,2,......m;在公式(1)中,其中,和分别是第j个指标数据的样本均值和样本标准差;2.通过标准化矩阵z计算相关系数矩阵r;相关系数矩阵计算如下:其中,(2),其中1≤j≤m;在公式(2)中,是第i个指标与第j个指标的相关系数。
46.3.通过求解相关系数矩阵r获得单位特征向量;具体的:求解相关系数矩阵r的特征方程 ,其中,λ是矩阵r的特征值,这里的 为单位主对角线矩阵;按信息利用率,即确定m值,使信息的利用率达85%以上,对每个,1≤j≤m,求解方程组获得单位特征向量;4.根据单位特征向量转化获得p个主成分;具体的,将标准化后的指标变量转换为主成分,1≤j≤m,其中,称为第一主成分,称为第二主成分,以此类推,称为第p主成分。
47.进一步的,还可以包括:对p个主成分进行综合评价获得最终评价值。即对p个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。
48.步骤s42:基于所述降维处理后得到的数据,采用朴素贝叶斯算法训练异常行为发现模型;本步骤所述朴素贝叶斯算法的工作流程具体如下:1.将经过主成分分析降维后得到的数据设为表示训练样本的特征属性集,每个样本有d个特征,特征属性集记为,特征输出有k个类别,c表示类集合,定义为;其中1≤i≤k,1≤j≤d。在本例中,k设置为2,即“有异常”和“无异常”两种
类别。
49.2.对每个特征计算先验概率和条件概率;3.对每个类别计算后验概率;4.输出后验概率最大项作为样本所属类别。
50.步骤s5:根据待测人员的信息数据以及所述异常行为发现模型获得对所述待测人员的行为类别的预测结果。
51.具体的,在实际应用时,本步骤包括基于待测人员的信息数据得到所述异常行为发现模型的输入数据,根据模型的输出确定待测人员的异常行为风险概率,进而确定待测人员的行为类别即异常与否。
52.优选地,在所述步骤s4之后还包括对所述异常行为发现模型的检验评估和自动优化。
53.模型检验评估:利用验证样本数据对异常行为发现模型进行检验、评估和优化。
54.自动学习优化:基于新增的目标信息数据,自动优化模型,不断提高模型预测的准确率。
55.本发明基于主成分分析方法进行重点人员异常行为指标体系的降维数据处理,得出具有一定重要度的主成分特征,并将得出的主成分特征训练朴素贝叶斯算法模型,通过训练好的模型根据重点人员的异常行为发现的指标体系特征自动生成对应的风险概率。
56.采用朴素贝叶斯和主成分分析法相结合的方式,具有对缺失数据的容忍度较高,更适于数据质量不高的应用场景的应用优点,同时基于新收集数据对预测模型进行不断迭代更新和优化,可以使得预测结果准确率、可靠性和实时性更高。
57.实施例二下面采用一个具体的实施例,对图3中所示装置实施例的技术方案进行详细说明。
58.本实施例基于实施例一的基础上提供的异常行为预测装置200,如图3所示,该装置包括大数据获取模块201、指标体系构建模块202、指标体系数据产生模块203、模型训练模块204和预测结果输出模块205,各个模块的功能具体如下:大数据获取模块201,用于获取目标信息数据。具体的,获取的目标信息数据包括人员基本信息数据、出入特定地点的人像数据、消费信息数据、交通出行数据、生活缴费数据、行为异常数据等。
59.进一步的,所述大数据获取模块201还可以具体包括第一分析单元、第二分析单元和获取单元;所述第一分析单元,用于获取重点人员的第一大数据信息,进行第一异常行为发现分析;例如,所述第一异常行为发现分析具体为重点人员关联重点区域危险异常分析,其分析结果包括重点区域的重点人员分布时间变化、重点区域来源分布情况、重点区域重点人员的聚集态势、重点区域重点人员的出行频次。
60.所述第二分析单元,用于获取重点人员的第二大数据信息进行第二异常行为发现分析;例如,所述第二异常行为发现分析具体为重点人员异常行为发现分析,其分析结果包括重点人员从业行业变化、重点人员昼伏夜出和早出晚归情况。
61.所述获取单元,用于将所述第一分析单元和第二分析单元进行的的两次分析的分
析结果作为参考获取目标信息数据。
62.指标体系构建模块202,用于基于所述大数据获取模块201获取的所述目标信息数据构建异常行为发现的指标体系。
63.构建所述异常行为发现的指标体系可以具体为:通过对目标信息数据的类别分析建立设预设个数的一级指标,以及为各个一级指标下设若干个二级指标,关于一级指标和二级指标的个数的设置可以根据实际需要进行调整。例如,构建四个一级指标:生活轨迹指标、出行轨迹指标、基本信息指标、行为异常指标。
64.指标体系数据产生模块203,用于根据所述目标信息数据和所述异常行为发现的指标体系,通过大数据关联碰撞获得指标体系数据。
65.模型训练模块204,用于基于所述指标体系数据产生模块203所产生的所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型。
66.进一步的,所述模型训练模块204可以具体包括数据降维单元和模型训练单元;所述数据降维单元,用于运用主成分分析法对所述指标体系数据进行降维处理;所述模型训练单元,用于基于所述降维处理后得到的数据,采用朴素贝叶斯算法训练异常行为发现模型;预测结果输出模块205,用于根据待测人员信息数据得到所述异常行为发现模型的输入,以及根据所述异常行为发现模型的输出获得对所述待测人员的行为类别的预测结果。
67.具体的,根据异常行为发现模型的输出可以确定待测人员的异常行为风险概率,进而确定待测人员的行为类别即异常与否。
68.本实施例的装置还可以包括模型检验评估模块和自动学习优化模块;所述模型检验评估模块,用于利用验证样本数据对异常行为发现模型进行检验、评估和优化。
69.所述自动学习优化模块,用于基于新增的目标信息数据,自动优化模型。
70.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
71.尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
72.为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
73.实施例三本发明的实施例还提供了一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行前述实施例中的基于大数据的重点人员异常行为预测方法。
74.本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现所述的基于大数据的重点人员异常行为预测方法。
75.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的
示例,本实施例在此不再赘述。
76.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
77.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
技术特征:1.一种基于大数据的重点人员异常行为预测方法,其特征在于:所述方法包括:获取目标信息数据,并基于所述目标信息数据构建异常行为发现的指标体系;根据所述目标信息数据和所述异常行为发现的指标体系,通过大数据关联碰撞获得指标体系数据;基于所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型;根据待测人员的信息数据以及所述异常行为发现模型获得对所述待测人员的行为类别的预测结果。2.根据权利要求1所述的方法,其特征在于:所述目标信息数据包括人员基本信息数据、出入特定地点的人像数据、消费信息数据、交通出行数据、生活缴费数据、行为异常数据。3.根据权利要求1所述的方法,其特征在于:所述异常行为发现的指标体系为两级指标体系,所述构建异常行为发现的指标体系具体为:通过对所述目标信息数据的类别分析建立设预设个数的一级指标,以及为各个一级指标下设二级指标。4.根据权利要求3所述的方法,其特征在于:所述一级指标包括生活轨迹指标、出行轨迹指标、基本信息指标、行为异常指标。5.根据权利要求1所述的方法,其特征在于:所述方法还包括获取重点人员的第一大数据信息,进行第一异常行为发现分析;以及获取重点人员的第二大数据信息进行第二异常行为发现分析,将两次分析的分析结果作为参考依据获取所述目标信息数据以及构建异常行为发现的指标体系。6.根据权利要求1所述的方法,其特征在于:所述基于所述指标数据,利用主成分分析方法和朴素贝叶斯算法构建异常行为发现模型具体为:运用主成分分析方法对所述指标体系数据进行降维处理,基于降维处理后得到的数据,采用朴素贝叶斯算法训练得到异常行为发现模型。7.根据权利要求6所述的方法,其特征在于:所述训练得到异常行为发现模型之后还包括对所述异常行为发现模型的检验评估和自动学习优化;所述检验评估具体为,利用验证样本数据对异常行为发现模型进行检验、评估和优化;所述自动学习优化具体为,基于新增的目标信息数据,自动优化模型。8.一种基于大数据的重点人员异常行为预测装置,其特征在于:所述装置包括大数据获取模块、指标体系构建模块、指标体系数据产生模块、模型训练模块和预测结果输出模块;所述大数据获取模块,用于获取目标信息数据;所述指标体系构建模块,用于基于所述大数据获取模块获取的所述目标信息数据构建异常行为发现的指标体系;所述指标体系数据产生模块,用于根据所述目标信息数据和所述异常行为发现的指标体系,通过大数据关联碰撞获得指标体系数据;所述模型训练模块,用于基于所述指标体系数据产生模块所产生的所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型;所述预测结果输出模块,用于根据待测人员信息数据得到所述异常行为发现模型的输入,以及根据所述异常行为发现模型的输出获得对所述待测人员的行为类别的预测结果。9.一种电子设备,其特征在于:包括至少一个处理器,以及与所述至少一个处理器通信
连接的存储器,其中,所述存储器存储有指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7中任一所述的方法。10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述权利要求1-7任一权利要求所述的方法。
技术总结本发明公开一种基于大数据的重点人员异常行为预测方法及装置,属于互联网大数据领域。该方法包括获取目标信息数据,并基于所述目标信息数据构建异常行为发现的指标体系;根据所述目标信息数据和所述异常行为发现的指标体系,通过大数据关联碰撞获得指标体系数据;基于所述指标体系数据,利用主成分分析法和朴素贝叶斯算法构建异常行为发现模型;根据待测人员的信息数据以及所述异常行为发现模型获得对所述待测人员的行为类别的预测结果。本发明从大数据多源多视角研究重点人员行为模式,提高了重点人员风险评估的效率与准确性,相较传统的处理方法,业务性更高,数据范围广,能够更快速高效地对异常发现行为数据进行融合。融合。融合。
技术研发人员:杨水利 吴建平 杨静 郭伟 谢辉 侯丽青
受保护的技术使用者:北京数网信息技术有限公司
技术研发日:2022.07.19
技术公布日:2022/11/1