本技术涉及人工智能,特别是涉及一种识别模型的构建方法、识别方法、装置、设备、存储介质和程序产品。
背景技术:
1、随着电子信息与网络通信技术的不断更新发展,电信技术为人们带来了便捷的通讯、购物、社交、游戏等新功能体验。然而,随着电信技术的不断发展变化,电信网络中也相继出现了电信欺诈、电信诱导等不良行为,给电信网络用户带来了极大的网络隐患。
2、现有技术中,电信网络平台一般通过采集用户终端在通话过程中的电话号码,并对电话号码进行识别,从而判断该电话号码是否属于非法电话号码,并在确定电话号码属于非法电话号码的情况下,再提醒用户终端当前的通话对象属于非法人员,使用户终端执行电信防炸保护操作,来提高用户终端的电信通话安全性。
3、然而,上述基于电话号码的识别方法存在识别准确度低的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高电信欺诈的识别准确度的识别模型的构建方法、识别方法、装置、设备、存储介质和程序产品。
2、第一方面,本技术提供了一种识别模型的构建方法,包括:
3、获取各类型业务的样本数据和预设风险指标;
4、根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型;
5、对目标识别模型进行准确性验证,得到验证后的目标识别模型。
6、上述方法根据样本数据和预设风险指标,同时对初始识别模型进行训练得到目标识别模型,与现有的仅基于样本数据构建识别模型的方法相比,本技术构建的目标识别模型由于考虑了预设风险指标,能够更加准确的对风险进行识别;另外,在构建完目标识别模型之后,还对目标识别模型进行准确性验证,进一步保证了目标识别模型的识别准确度。
7、在其中一个实施例中,上述根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型,包括:
8、根据预设高低维转换关系,对各类型业务的样本数据进行降维处理,得到降维处理后的样本数据;降维处理是指使用降维处理后的样本数据模拟降维处理之前的样本数据之间的相似性;
9、根据降维处理后的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型。
10、本技术实施例提供的方法,通过对样本数据进行降维处理,使得降维处理后的样本数据能够降低识别模型在训练过程中的收敛难度,提高识别模型的训练效率。
11、在其中一个实施例中,上述根据预设高低维转换关系,对各类型业务的样本数据进行降维处理,得到降维处理后的样本数据,包括:
12、根据预设高低维转换关系,对各类型业务的样本数据进行降维处理,得到中间处理样本数据;
13、根据各类型业务的样本数据中任意两个样本数据之间的第一相似度和中间处理样本数据中任意两个样本数据之间的第二相似度,得到降维处理后的样本数据。
14、本技术实施例提供的降维方法,基于高维空间的数据之间的相似度和低维空间的数据之间的相似度,获取降维后的样本数据,为后续基于降维后的数据训练识别模型提供数据基础。
15、在其中一个实施例中,上述根据各类型业务的样本数据中任意两个样本数据之间的第一相似度和中间处理样本数据中任意两个样本数据之间的第二相似度,得到降维处理后的样本数据,包括:
16、确定各类型业务的样本数据中任意两个样本数据之间的第一相似度;
17、确定中间处理样本数据中任意两个样本数据之间的第二相似度;
18、基于相似度相同原则,根据第一相似度和第二相似度对预设高低维转换关系进行调整,并基于调整后的预设高低维转换关系对各类型业务的样本数据进行降维处理,得到降维处理后的样本数据。
19、本技术实施例提供的降维方法,基于高维空间的数据之间的相似度和低维空间的数据之间的相似度,获取降维后的样本数据,为后续基于降维后的数据训练识别模型提供数据基础。
20、在其中一个实施例中,上述根据第一相似度和第二相似度对预设高低维转换关系进行调整,并基于调整后的预设高低维转换关系对各类型业务的样本数据进行降维处理,得到降维处理后的样本数据,包括:
21、确定第一相似度和第二相似度是否一致;
22、若第一相似度和第二相似度一致,则将中间处理样本数据作为降维处理后的样本数据;
23、若第一相似度和第二相似度不一致,则对预设高低维转换关系进行调整,并基于调整后的预设高低维转换关系,返回执行根据预设高低维转换关系,对各类型业务的样本数据进行降维处理,得到中间处理样本数据的步骤。
24、本技术实施例提供的降维方法,基于高维空间的数据之间的相似度和低维空间的数据之间的相似度,获取降维后的样本数据,为后续基于降维后的数据训练识别模型提供数据基础。
25、在其中一个实施例中,上述方法还包括:
26、对各类型业务的样本数据进行特征提取,得到样本数据的数据特征;数据特征包括关键特征、非法行为过程特征、对象行为特征、非法转移资源特征;
27、根据预设高低维转换关系,对各类型业务的样本数据进行降维处理,得到降维处理后的样本数据,包括:
28、根据预设高低维转换关系,对样本数据的数据特征进行降维处理,得到降维处理后的样本数据。
29、本技术实施例提供的数据特征提取方法,保证了数据在输入初始识别模型训练之前,各个样本数据的数据点距离较近,方便各个聚类中心的移动,提高初始识别模型的训练效率。
30、在其中一个实施例中,上述根据降维处理后的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型,包括:
31、根据预设风险指标制定识别规则;识别规则包括预设风险指标中各指标范围对应的风险程度;
32、将降维处理后的样本数据和识别规则输入至初始识别模型,使初始识别模型基于识别规则进行训练,构建目标识别模型。
33、本技术实施例提供的目标识别模型的构建方法,先根据预设风险指标制定识别规则,然后再基于识别规则和降维处理后的样本数据对初始识别模型进行训练,极大提高了模型的训练效率。
34、在其中一个实施例中,上述对目标识别模型进行准确性验证,得到验证后的目标识别模型,包括:
35、将验证样本数据输入至目标识别模型进行识别,得到验证样本数据对应的风险值;
36、通过统计验证样本数据对应的风险值,确定目标识别模型的指标命中率;指标命中率包括目标识别模型的指标误报率和用户命中率;
37、根据目标识别模型的指标命中率,得到验证后的目标识别模型。
38、本技术实施例提供的目标识别模型的验证方法,保证了目标识别模型的识别准确度。
39、在其中一个实施例中,上述方法还包括:
40、对各类型业务的样本数据进行标准化处理,得到标准化处理后的样本数据;标准化处理包括数据清洗处理、数据转换处理、数据规范化处理和数据验证处理中的至少一种;
41、根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型,包括:
42、根据标准化处理后的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型。
43、本技术实施例提供的标准化处理方法,确保了信息的准确性和规范性,为后续基于标准化处理后的样本数据训练识别模型提供数据基础,进一步提高了训练的模型的准确度。
44、第二方面,本技术提供了一种识别方法,包括:
45、获取待识别用户的业务交互信息;
46、对业务交互信息进行特征提取,得到业务交互信息对应的业务特征;
47、根据业务特征和目标识别模型进行非法行为的风险识别,得到业务交互信息对应的风险值;目标识别模型是根据各类型业务的样本数据和预设风险指标对初始识别模型进行训练得到,且经过准确性验证。
48、本技术实施例提供的识别方法,通过提取业务交互信息中的业务特征,并根据业务特征基于识别模型识别业务交互信息对应的风险值,实现了对业务交互信息中风险行为的有效识别。
49、第三方面,本技术还提供了一种识别模型的构建装置,包括:
50、获取模块,用于获取各类型业务的样本数据和预设风险指标;
51、训练模块,用于根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型;
52、验证模块,用于对目标识别模型进行准确性验证,得到验证后的目标识别模型。
53、第四方面,本技术还提供了一种识别装置,包括:
54、获取模块,用于获取待识别用户的业务交互信息;
55、提取模块,用于对业务交互信息进行特征提取,得到业务交互信息对应的业务特征;
56、识别模块,用于根据业务特征和目标识别模型进行非法行为的风险识别,得到业务交互信息对应的风险值;目标识别模型是根据各类型业务的样本数据和预设风险指标对初始识别模型进行训练得到,且经过准确性验证。
57、第五方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
58、获取各类型业务的样本数据和预设风险指标;
59、根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型;
60、对目标识别模型进行准确性验证,得到验证后的目标识别模型。
61、第六方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
62、获取各类型业务的样本数据和预设风险指标;
63、根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型;
64、对目标识别模型进行准确性验证,得到验证后的目标识别模型。
65、第七方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
66、获取各类型业务的样本数据和预设风险指标;
67、根据各类型业务的样本数据和预设风险指标,对初始识别模型进行训练,构建目标识别模型;
68、对目标识别模型进行准确性验证,得到验证后的目标识别模型。
69、上述识别模型的构建方法、识别方法、装置、设备、存储介质和程序产品,上述方法根据样本数据和预设风险指标,同时对初始识别模型进行训练得到目标识别模型,与现有的仅基于样本数据构建识别模型的方法相比,本技术构建的目标识别模型由于考虑了预设风险指标,能够更加准确的对风险进行识别;另外,在构建完目标识别模型之后,还对目标识别模型进行准确性验证,进一步保证了目标识别模型的识别准确度。
1.一种识别模型的构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述各类型业务的样本数据和所述预设风险指标,对初始识别模型进行训练,构建目标识别模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据预设高低维转换关系,对所述各类型业务的样本数据进行降维处理,得到降维处理后的样本数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述各类型业务的样本数据中任意两个样本数据之间的第一相似度和所述中间处理样本数据中任意两个样本数据之间的第二相似度,得到所述降维处理后的样本数据,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一相似度和所述第二相似度对所述预设高低维转换关系进行调整,并基于调整后的预设高低维转换关系对所述各类型业务的样本数据进行降维处理,得到降维处理后的样本数据,包括:
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
7.根据权利要求2所述的方法,其特征在于,所述根据所述降维处理后的样本数据和所述预设风险指标,对初始识别模型进行训练,构建目标识别模型,包括:
8.根据权利要求1所述的方法,其特征在于,所述对所述目标识别模型进行准确性验证,得到验证后的目标识别模型,包括:
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
10.一种识别方法,其特征在于,所述方法包括:
11.一种识别模型的构建装置,其特征在于,所述装置包括:
12.一种识别装置,其特征在于,所述装置还包括:
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。