本技术涉及数据处理,尤其涉及一种城市运行指标的分解方法、终端设备、存储介质及计算机程序产品。
背景技术:
1、随着互联网技术的不断发展,越来越多的技术人员在进行城市运行管理工作时,会采用对环境质量、交通状况、公共安全、城市规划方面等各种基准指标数据进行处理的方式,以获取自身所需的城市运行数据,然而,相关基准指标数据通常需要对获取的派生指标进行拆分后才能获取。
2、在相关技术中,技术人员在获取派生指标后,需要手动对派生指标进行分解以得到各业务维度限定词类、时间维度限定词类及地区维度限定词类等不同计算维度下包含的指标名称,进而将提取到的各指标名称输入至终端设备才能获取城市运行数据。
3、但是,采用上述手动对各派生指标进行分解的方式,通常需要耗费技术人员大量的时间精力和成本,且手动分解得到的各指标信息在准确性和实时性上存在一定缺陷,进而导致终端设备获取的城市运行数据存在准确性较低的情况。
技术实现思路
1、本技术的主要目的在于提供一种城市运行指标的分解方法、终端设备、存储介质及计算机程序产品,旨在解决相关技术中终端设备获取的城市运行数据存在准确性较低的技术问题。
2、为实现上述目的,本技术提出一种城市运行指标的分解方法,所述城市运行指标的分解方法包括:
3、接收待拆解城市运行指标;
4、通过目标分词模型对所述待拆解城市运行指标进行分词处理,以确定所述待拆解城市运行指标对应的各指标名称词向量;
5、获取多个预设标准词向量,并确定各所述指标名称词向量各自和多个所述预设标准词向量之间的各相似度数值;
6、基于各所述相似度数值对各所述指标名称词向量进行聚类处理生成各指标词向量清单,以根据各所述指标词向量清单获取城市运行数据。
7、在一实施例中,所述通过目标分词模型对所述待拆解城市运行指标进行分词处理,以确定所述待拆解城市运行指标对应的各指标名称词向量的步骤,包括:
8、获取目标分词模型,并将所述待拆解城市运行指标输入至所述目标分词模型;
9、通过所述目标分词模型对所述待拆解城市运行指标进行分词处理,以确定所述待拆解城市运行指标对应的各城市指标名称;
10、通过所述目标分词模型对各所述城市指标名称进行转换,以确定各所述城市指标名称各自对应的指标名称词向量。
11、在一实施例中,所述基于各所述相似度数值对各所述指标名称词向量进行聚类处理生成各指标词向量清单的步骤,包括:
12、确定多个预设相似度数值范围;
13、将各所述相似度数值分别和多个所述预设相似度数值范围进行比对,以确定各所述相似度数值各自对应的目标相似度数值范围;
14、基于各所述目标相似度数值范围确定各所述指标名称词向量各自对应的目标预设标准指标类型;
15、根据各所述目标预设标准指标类型,对各所述指标名称词向量进行聚类处理生成各指标词向量清单。
16、在一实施例中,所述基于各所述目标相似度数值范围确定各所述指标名称词向量各自对应的目标预设标准指标类型的步骤,包括:
17、确定多个预设标准词向量,和多个所述预设标准词向量各自对应的预设标准指标类型;
18、基于各所述目标相似度数值范围,确定各所述指标名称词向量各自对应的目标预设标准词向量;
19、基于各所述目标预设标准词向量,确定各所述指标名称词向量各自对应的目标预设标准指标类型。
20、在一实施例中,在所述接收待拆解城市运行指标的步骤之后,所述方法还包括:
21、对所述待拆解城市运行指标进行识别,以判断所述待拆解城市运行指标是否为派生指标;
22、若判断到所述待拆解城市运行指标不为派生指标,则获取预设的非派生标识信息,并基于所述非派生标识信息和所述待拆解城市运行指标生成非派生指标提示信息;
23、将所述非派生指标提示信息发送至数据源终端,其中,所述数据源终端为生成所述待拆解城市运行指标的终端设备。
24、在一实施例中,在所述接收待拆解城市运行指标的步骤之前,所述方法包括:
25、获取初始分词模型;
26、确定多个预设标准指标名称,和多个所述预设标准指标名称各自对应的预设标准词向量;
27、基于多个所述预设标准指标名称和多个所述预设标准词向量对所述初始分词模型进行训练,以生成目标分词模型。
28、在一实施例中,所述基于多个所述预设标准指标名称和多个所述预设标准词向量对所述初始分词模型进行训练,以生成目标分词模型的步骤,包括:
29、将多个所述预设标准指标名称输入至所述初始分词模型,并确定所述初始分词模型输出的待验证词向量,其中,所述待验证词向量为所述初始分词模型基于所述预设标准指标名称生成的词向量;
30、基于各所述验证词向量和多个所述预设标准词向量,确定所述初始分词模型的分词成功率;
31、在检测到所述分词成功率达到预设的成功率阈值的情况下,将所述初始分词模型确定为目标分词模型。
32、此外,为实现上述目的,本技术还提出一种终端设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的城市运行指标的分解方法的步骤。
33、此外,为实现上述目的,本技术还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的城市运行指标的分解方法的步骤。
34、此外,为实现上述目的,本技术还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的城市运行指标的分解方法的步骤。
35、本技术实施例提供的城市运行指标的分解方法,通过接收待拆解城市运行指标;通过接收待拆解城市运行指标;通过目标分词模型对所述待拆解城市运行指标进行分词处理,以确定所述待拆解城市运行指标对应的各指标名称词向量;获取多个预设标准词向量,并确定各所述指标名称词向量各自和多个所述预设标准词向量之间的各相似度数值;基于各所述相似度数值对各所述指标名称词向量进行聚类处理生成各指标词向量清单,以根据各所述指标词向量清单获取城市运行数据。
36、在本实施例中,终端设备在运行时,首先接收数据源终端发送的待拆解城市运行指标,之后,终端设备将获取的待拆解城市运行指标输入至目标分词模型,从而由目标分词模型对待拆解城市运行指标进行分词处理,以确定待拆解城市运行指标对应的各指标名称词向量,再之后,终端设备获取多个预设标准词向量,并将各指标名称词向量分别和多个预设标准词向量进行比对,从而确定各指标名称词向量各自和多个预设标准词向量之间产生的相似度数值,最后,终端设备基于各相似度数值对各指标名称词向量进行聚类处理,从而生成各包含相同类型的指标名称词向量的指标词向量清单,进而根据各指标词向量清单执行数据分析操作以获取各城市运行数据。
37、如此,本技术解决了相关技术中终端设备获取的城市运行数据存在准确性较低的技术问题,即,本技术通过调用目标分词模型对待拆解城市运行指标进行拆分得到待拆解城市运行指标对应的各指标名称词向量,进而对各指标名称词向量进行聚类,从而得到多个包含相同类型指标名称词向量的指标词向量清单,技术人员无需进行人工计算的情况下,即可对复杂的城市运行指标进行拆分以得到不同计算维度下包含的指标名称,进而在达到了令终端设备能够获取准确的城市运行数据。
1.一种城市运行指标的分解方法,其特征在于,所述城市运行指标的分解方法包括:
2.如权利要求1所述的城市运行指标的分解方法,其特征在于,所述通过目标分词模型对所述待拆解城市运行指标进行分词处理,以确定所述待拆解城市运行指标对应的各指标名称词向量的步骤,包括:
3.如权利要求2所述的城市运行指标的分解方法,其特征在于,所述基于各所述相似度数值对各所述指标名称词向量进行聚类处理生成各指标词向量清单的步骤,包括:
4.如权利要求3所述的城市运行指标的分解方法,其特征在于,所述基于各所述目标相似度数值范围确定各所述指标名称词向量各自对应的目标预设标准指标类型的步骤,包括:
5.如权利要求1所述的城市运行指标的分解方法,其特征在于,在所述接收待拆解城市运行指标的步骤之后,所述方法还包括:
6.如权利要求1至5中任一项所述的城市运行指标的分解方法,其特征在于,在所述接收待拆解城市运行指标的步骤之前,所述方法包括:
7.如权利要求6所述的城市运行指标的分解方法,其特征在于,所述基于多个所述预设标准指标名称和多个所述预设标准词向量对所述初始分词模型进行训练,以生成目标分词模型的步骤,包括:
8.一种终端设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至7中任一项所述的城市运行指标的分解方法的步骤。
9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的城市运行指标的分解方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的城市运行指标的分解方法的步骤。
