数据处理方法、装置、电子设备及存储介质与流程

专利2023-03-06  131



1.本发明涉及计算机处理技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。


背景技术:

2.目前,随着智能电网的不断推进,电力系统信息化程度不断提高,用电信息采集系统、配网gis系统、配网自动化系统等逐渐完善,配用电数据呈现出数据量大、类型多、增长快等大数据特征,显然,在这海量的数据中,要想一对一地对每一个负荷实现控制是不切实际的,因此需要进行电力负荷聚类,把用户的负荷数据序列从大数据平台中提取出来,并根据行业特性进行分类,挖掘出各类用户的用电行为或用电特性等信息,完成对负荷预测、电网规划和需求侧响应的指导。
3.传统的负荷数据序列聚类方法通常采用k-means、模糊c均值等算法以欧式距离作为相似性判据对采集的海量的负荷数据序列进行聚类。由于负荷数据量的规模不断增长,采用该类方法存在计算效率低的问题。


技术实现要素:

4.本发明提供了一种数据处理方法、装置、电子设备及存储介质,以实现在保证聚类精度的同时,达到提高聚类计算效率的技术效果。
5.根据本发明的一方面,提供了一种数据处理方法,该方法包括:
6.获取各用电设备所对应的至少一组待处理电力数据;其中,所述待处理电力数据中包括电力值序列;
7.基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;
8.基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别。
9.根据本发明的另一方面,提供了一种数据处理装置,该装置包括:
10.待处理电力数据获取模块,用于获取各用电设备所对应的至少一组待处理电力数据;其中,所述待处理电力数据中包括电力值序列;
11.待使用电力数据确定模块,用于基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;
12.目标聚类中心确定模块,用于基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别。
13.根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
14.至少一个处理器;以及
15.与所述至少一个处理器通信连接的存储器;其中,
16.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据处理方法。
17.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据处理方法。
18.本发明实施例的技术方案,通过获取各用电设备所对应的至少一组待处理电力数据;其中,待处理电力数据中包括电力值序列;基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别,解决了现有技术中基于k-means算法对多组数据序列进行聚类,导致聚类效率低的问题,实现了通过利用卷积自编码器对各待处理电力数据降维处理,得到高表达性、降维后的待使用电力数据,在保证聚类精度的同时,提高聚类计算效率。
19.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
20.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1是根据本发明实施例一提供的一种数据处理方法的流程图;
22.图2是根据本发明实施例二提供的一种数据处理方法的流程图;
23.图3是根据本发明实施例三所适用的训练得到卷积自编码器方法示意图;
24.图4是根据本发明实施例四提供的一种数据处理装置的结构示意图;
25.图5是实现本发明实施例的数据处理方法的电子设备的结构示意图。
具体实施方式
26.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
27.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28.实施例一
29.图1是根据本发明实施例一提供的一种数据处理方法的流程图,本实施例可适用于聚类情况,该方法可以由数据处理装置来执行,该数据处理装置可以采用硬件和/或软件的形式实现,该数据处理装置可配置于计算设备中。如图1所示,该方法包括:
30.s110、获取各用电设备所对应的至少一组待处理电力数据。
31.其中,用电设备可以为电表。待处理电力数据中包括电力值序列。电力值可以为电网的电力负荷值,如功率值。
32.在本实施例中,可以通过接收各用电设备上传的预设时长内的电力值序列,可以将一个预设时长内的电力值序列作为一组待处理电力数据,例如,可以将获取的日负荷数据作为一组待处理电力数据,以通过对各日负荷数据进行聚类分析,基于聚类结果快速判断所属聚类的日负荷数据为哪种用电类别,以分析其用电模式,提高电力数据分析效率。
33.s120、基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据。
34.其中,卷积自编码器可以为cae(convolutional auto-encode)网络,用于进行特征降维,卷积自编码器中可以包括输入层、隐藏层和输出层。
35.需要说明的是,卷积自编码器是基于电力样本数据训练确定的,在测试调优的过程中确定了卷积自编码器的输出维数以及编码、解码层数等超参数。同时在训练得到卷积自编码器时,为了得到最近似输入的输出,即构造出最优的输入表达,通过将输入的样本和最终特征重构出来的结果进行欧式距离比较,控制欧式距离处于最小,以使在特征提取时,保证特征的高表达性。
36.在实际应用中,可以将各待处理电力数据输入卷积自编码器,由卷积自编码器进行特征提取,得到各待处理电力数据降维后所对应的待使用电力数据,例如,可以将每组待处理电力数据作为一个日负荷数据序列,相应的可以日负荷数据序列集输入到cae网络的第1层,进行特征提取,通过最小化稀疏成本函数确定并输出隐含层序列,进而将输出的隐含层序列输入到cae网络的第2层,同第1层相同方法进行特征提取,输出隐含层序列,依此类推,将第i-1层的隐含层序列输入到cae网络的第i层,输出隐含层序列。直到i到达cae网络模型层数,输出第i层的隐含层序列作为深层特征序列,即待使用电力数据集,用于后续的聚类。
37.可选的,训练得到卷积自编码器的实现方式可以是:获取多个训练样本数据;针对各训练样本数据,将当前训练样本数据作为待训练卷积自编码器的输入,得到当前训练样本数据所对应的输出数据;根据输出数据和相应训练样本数据训练待训练卷积自编码器;将待训练卷积自编码器中的损失函数收敛作为训练目标,得到卷积自编码器。
38.需要说明的是,为了提高模型的降维的快捷性,和保证模型输出的高表达性,可以
尽可能大量且丰富的获取训练样本数据。
39.其中,训练样本数据中包括用电设备的电力参数。电力参数与待处理电力数据相对应,可以均为日负荷数据。待训练卷积自编码器中可以包含k个卷积核,k=1,

,n,每个卷积核由参数wk和bk组成,用hk表示卷积层,则卷积层hk=σ(x*wk+bk),x为输入,θ={w,b}为卷积核参数集合,σ为激活函数,*为卷积运算。
40.在实际应用中,可以获取无标签的训练样本集x={x1,x2,

,xn},训练样本集中包括多个训练样本数据,每个训练样本数据可以为一组日负荷序列。可以将当前训练样本数据输入待训练卷积自编码器,得到当前训练样本数据所对应的降维后的输出数据。可以基于输入数据和输出数据之间的相似度训练模型。如,可以将输入的样本和最终特征重构出来的结果进行欧式距离比较,通过bp算法进行优化,直至欧式距离小于预设阈值,或者,迭代次数达到预设次数时,认为达到训练目标,测试调优确定caes的输出维数以及编码、解码层数等超参数,得到训练好的卷积自编码器。
41.本技术方案通过卷积自编码器对待处理电力数据进行特征提取,降低待处理电力数据的降维,得到维度较低且高表达性的待使用电力数据,实现在保证聚类结果准确,聚类鲁棒性高的前提下,达到大幅提升聚类的计算效率的技术效果。
42.s130、基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别。
43.需要说明的是,在分析海量的日负荷数据时,为了提高分析效率,可以将各日负荷数据进行聚类处理,得到多个簇,每个簇内对应一个聚类中心,可以将聚类中心所对应的日负荷数据作为聚类电力数据,将簇内的电力数据作为关联电力数据,同一簇内的电力数据所对应的用电情况可能是差异较小的,即相似度较高,不同簇间的电力数据所对应的用电情况可能是差异较大的,即相似度较小。其中,聚类中心可以为簇内关联电力数据的中心或平均值。
44.在实际应用中,在接收到各待使用电力数据后,可以计算各待使用电力数据与当前已有的聚类中心之间的相似度,如计算待使用电力数据a和聚类中心所对应的聚类电力数据b之间余弦相似度、欧氏距离、曼哈顿距离、或者dtw(dynamic time warping,动态时间归整)距离等等,作为相似度,如果相似度越高,或距离越小,可以表示两项数据越相似,可以将待使用电力数据分配至与之最相似的聚类中心所对应的簇,此时当前已有的聚类中心所对应的簇内电力数据可能发生了更新,簇所对应的聚类中心会根据簇内现有的电力数据被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)电力数据被重新分配给不同的簇,也可以是没有(或最小数目)聚类中心再发生变化,如误差平方和局部最小。
45.需要说明的是,在聚类完成后,可以基于此时的分类结果,对应用电设备的数据进行用电分析,可选的,基于相应目标聚类中心所对应的聚类电力数据,确定与目标聚类中心相对应的用电类别,包括:确定隶属于同一目标聚类中心的待分析电力数据所对应的电力分布曲线;根据各电力分布曲线上的电力波动信息,确定与目标聚类中心相对应的用电类别。
46.在本实施例中,可以绘制隶属于同一目标聚类中心的待分析电力数据所对应的电力分布曲线进行展示,分析各电力分布曲线上的电力波动信息,或者通过比较不同目标聚类中心所对应的电力分布曲线上的电力波动信息,确定各目标聚类中心相对应的用电类别,如用电类别分为居民用户、小商户、大商户等等,提高分析的便捷性和准确性。
47.本实施例的技术方案,通过获取各用电设备所对应的至少一组待处理电力数据;其中,待处理电力数据中包括电力值序列;基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别,解决了现有技术中基于k-means算法对多组数据序列进行聚类,导致聚类效率低的问题,实现了通过利用卷积自编码器对各待处理电力数据降维处理,得到高表达性、降维后的待使用电力数据,在保证聚类精度的同时,提高聚类计算效率。
48.实施例二
49.图2是根据本发明实施例二提供的一种数据处理方法的流程图,在前述实施例的基础上,对s130作进一步的细化。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
50.如图2所示,该方法具体包括如下步骤:
51.s210、获取各用电设备所对应的至少一组待处理电力数据。
52.s220、基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据。
53.s230、分别确定各待使用电力数据与当前已有的聚类中心所对应的聚类电力数据的相对误差值。
54.其中,相对误差值可以表征两组数据的相似程度,例如,相对误差值越小,可以认为相似度越高,距离越小,反之,相对误差值越大,可以认为相似度越小,距离越大。
55.在本实施例中,可以获取所有当前已有的聚类中心所对应的聚类电力数据,进而分别确定各待使用电力数据与每一个聚类电力数据的相似度,作为相对误差值,以基于待使用电力数据所对应的各相对误差值更新聚类中心以及每个簇内的电力数据。
56.需要说明的是,本技术方案为了提高相似度计算的准确性,可以综合考虑欧式距离和dtw(dynamic time warping,动态时间归整)距离来表征时序数据之间的相似度,即相对误差值,同时为了进一步的提高相似度计算的准确性,还可以结合待使用电力数据与聚类电力数据所对应的变化趋势综合确定电力数据之间的相似度,可选的,在确定各待使用电力数据与当前已有的聚类中心所对应的聚类电力数据的相对误差值之前,还包括:针对各待使用电力数据,基于当前待使用电力数据中当前电力值、后一电力值和时间间隔,确定当前电力值对应的参考值;将相应待使用电力数据所对应的各参考值,作为与相应待使用电力数据相对应的待使用参考数据。
57.其中,当前电力值的接收时刻早于后一电力值的接收时刻。待使用参考数据可以用于表征待使用电力数据的变化趋势。确定每组待使用电力数据所对应的待使用参考数据的方式均相同,以其中任一待使用电力数据作为当前待使用电力数据进行说明。
58.具体来说,可以将当前待使用电力数据中后一电力值与当前电力值作差,再将差值和时间间隔作商,将商值作为当前电力值对应的参考值,相应的,可以得到每个电力值所对应的参考值,可以将各参考值组合成参考值序列作为当前待使用电力数据所对应的待使用参考数据。示例性的,设降维后得到的电力值序列为x=[x1,x2,

,xn],即待使用电力数据,xn为第n个电力值,参考值计算公式为其中x

为第i个电力值所对应的参考值,相应的,可以求出其长度为n-1的趋势序列x

=[x
′1,x
′2,

,x

n-1
],作为x=[x1,x2,

,xn]的待使用参考数据。
[0059]
需要说明的是,在实际数据分析的过程中,各组待使用电力数据的序列长短或时间步存在不对齐的情况,欧氏距离无法有效计算两个时间序列的距离,特别是在峰值的时候。本技术方案通过综合考量两个序列数据之间的欧氏距离和dtw距离,以及两个序列数据所对应的趋势序列之间的dtw距离,确定两个序列数据的相似程度,提高相似度确定的准确性,进而提高聚类精度。
[0060]
在本实施例中,在确定各待使用电力数据与每一个当前已有的聚类中心的聚类电力数据的相对误差值的过程中,可以确定各待使用电力数据与每一个聚类电力数据之间的欧式距离;利用动态时间归整算法确定各待使用电力数据与每一个聚类电力数据的之间的第一距离;利用动态时间归整算法确定各待使用参考数据与每一个聚类电力数据相对应的待应用参考数据之间的第二距离;基于欧式距离、第一距离和第二距离,以及相应的权重值,确定相对误差值。
[0061]
其中,动态时间归整算法可以为dtw(dynamic time warping)算法,dtw算法用于衡量长度不同的两个数组或时间序列之间的相似性或计算两者间的距离。例如,dtw算法在比较两个序列数据的相似度(或距离)时,通过将其中一个序列进行线性放缩进行某种“扭曲”操作,以达到更好的对齐效果,可以存在一对多映射的情况,适用于复杂时间序列,属于弹性度量。
[0062]
具体的,可以确定各待使用电力数据与每一个聚类电力数据之间的欧式距离,如,待使用电力数据为x=[x1,x2,

,xn],聚类电力数据y=[y1,y2,

,yn],它们之间的欧式距离为d2(x,y),计算公式如公式(1)所示:
[0063][0064]
可以利用dtw算法求出x和y之间的dtw距离,作为第一距离,为d
dtw
(x,y),以及对应参考数据序列x

和y

的dtw距离d
dtw
(x

,y

),作为第二距离,进一步的,可以欧式距离d2(x,y)、第一距离d
dtw
(x,y)和第二距离d
dtw
(x

,y

),与相应的权重值,得到x和y之间的相对误差值,如相对误差值为d
all
(x,y)=αd2(x,y)+βd
dtw
(x,y)+γd
dtw
(x

,y

),α,β,γ为权重值。
[0065]
需要说明的是,相对误差值越小,意味着相似度越高,可用熵权法确定欧式距离、第一距离和第二距离的权重。若日负荷数据之间某个距离值相差越大,则其相应的熵值就会越小,蕴含的有效信息越多,相应的权重也会更大,相应的,为欧式距离、第一距离和第二距离分配相应的权重值。
[0066]
s240、根据各待使用电力数据所对应的至少一个相对误差值,确定各待使用电力
数据所关联的待使用聚类中心。
[0067]
在本实施例中,可以将每个待使用电力数据分配到相对误差值最小的聚类中心所对应簇内,即相对误差值最小的聚类中心作为相应的待使用电力数据的待使用聚类中心。
[0068]
s250、基于与所述待使用聚类中心相关联的关联电力数据,确定新的聚类中心,并将所述新的聚类中心作为当前已有的聚类中心,以在下次获取到待使用电力数据时,重新基于待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,直至聚类离散差值小于预设差值时结束,得到至少一个目标聚类中心。
[0069]
其中,所述聚类离散差值是基于当前已有的聚类中心和上一次已有的聚类中心的聚类离散度确定的。聚类离散度可以用于表征一组数据分布相对于中心数据分布的偏离程度,例如,在某一个簇内,簇内电力数据远离其聚类中心的程度。所述聚类离散度是基于聚类中心的聚类电力数据和与聚类中心相关联的关联电力数据确定的。
[0070]
在本实施例中,在确定各待使用电力数据所关联的待使用聚类中心,即确定了各待使用电力数据所隶属的簇,可以基于某个簇内的电力数据,即关联电力数据,重新确定该簇所对应的新的聚类中心,如,可以将簇a中各关联电力数据的平均值作为聚类中心。将新的聚类中心作为当前已有的聚类中心,以在重新对所有电力数据进行聚类时,基于当前已有的聚类中心所对应的聚类电力数据与其余电力数据之间的相对误差值,继续对为其余电力数据分配聚类中心,继续迭代确定新的聚类中心,直至聚类离散差值小于预设差值时结束,将最后的聚类中心作为目标聚类中心。示例性的,可以使用k-means算法进行聚类,初始化设定聚类中心个数为l、迭代次数为i,得到包含l个初始聚类中心的矩阵c=[c1,c2,
…cl
]
t
,c
l
表示第l类的聚类中心,其值为第l类聚类中心的聚类电力数据,计算每组待使用电力数据和聚类电力数据的相对误差值,将待使用电力数据归类到最相似(相对误差值最小)的那一类(即簇)中。并更新聚类中心矩阵,更新聚类中心矩阵如公式(2)所示:
[0071][0072]
公式(2)中,c
l
(i+1)为进行第i+1次迭代后第l类的聚类中心。n
l
为属于第l类的关联电力数据组数;yn为属于第l类的关联电力数据。判断是否要跳出迭代循环的指标可以为:聚类离散差值是否小于预设差值,聚类离散差值可以为|j
i+1-ji|,j
i+1
表示第i+1次迭代后的聚类离散度,ji表示第i次迭代后的聚类离散度,其中,ji聚类离散度计算可以为:例如预设差值为e,e为收敛极限值,当|j
i+1-ji|<e时,可以停止迭代,将c(i+1)作为目标聚类中心。否则直至达到预设迭代次数或相对误差值小于预设误差值时结束,得到至少一个目标聚类中心。或者,以及使当下次获取到待使用电力数据时,重新基于待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,,得到至少一个目标聚类中心,实现数据处理的实时性,快捷性。
[0073]
在本实施例中,在聚类完成,得到至少一个目标聚类中心之后,可以通过dbi(davies-bouldin)指标衡量所分聚类(即簇)数量是否满足需求,dbi越小意味着类内距离
越小,同时类间距离越大。可选的,在基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心之后,还包括:针对至少一个目标聚类中心,确定当前目标聚类中心与其余各目标聚类中心所对应的待使用相似度,并将最大待使用相似度作为目标相似度;基于各目标相似度,确定相似度均值;若相似度均值小于预设阈值,则基于相应目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别;或,若相似度均值未小于预设阈值,则调整当前已有的聚类中心的数量,以使基于调整后的数量,重新确定与数量相对应的聚类中心,以及使基于重新确定的各聚类中心、历史聚类数据以及待使用电力数据,确定至少一个目标聚类中心。
[0074]
需要说明的是,当前目标聚类中心区别于其余各目标聚类中心,例如,目标聚类中心为1、2、3、4,当前目标聚类中心为1,其余各目标聚类中心分别为2、3、4。相似度均值可以理解为dbi值,相似度均值越小,则说明聚类内聚拢度高,聚类间分散度越低,反之,相似度均值越大,则说明聚类内聚拢度低,聚类间分散度越高。
[0075]
在实际应用中,在确定当前目标聚类中心与其余各目标聚类中心所对应的相似度时,可以基于隶属于当前目标聚类中心所对应簇内的各组待分析电力数据,确定当前目标聚类中心对应的簇内聚拢度,基于当前目标聚类中心和区别于当前目标聚类中心的其余某个聚类中心的欧氏距离确定两者之间的簇间分散度。进而可以基于当前目标聚类中心的簇内聚拢度、所述其余某个聚类中心的簇内聚拢度,以及当前目标聚类中心与所述其余某个聚类中心之间的簇间分散度,确定当前目标聚类中心与所述其余某个聚类中心的相似度,作为待使用相似度,可以将各待使用相似度中最大值作为目标相似度。将各目标相似度的均值作为相似度均值。示例性的,k-means聚类质量的评价指标为dbi指标,即相似度均值,计算相似度均值i
dbi
的公式如下所示:
[0076][0077][0078]
其中,i
dbi
表示为相似度均值,r
wq
表示第w类和第q类聚类中心数据的待使用相似度;sw表示第w类聚类中心中数据的簇内聚拢度,sq表示第q类聚类中心中数据的簇内聚拢度;m
wq
为第w类中心与第q类聚类中心中数据点的簇间分散度。
[0079]
在上述方案的基础上,可以当相似度均值小于预设阈值,认为聚类结果合格,可以基于此时的目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别;或,当相似度均值未小于预设阈值,认为聚类结果不合格,可以调整当前已有的聚类中心的数量,以使基于调整后的数量,重新确定与数量相对应的聚类中心,随机选取该数量的聚类中心,基于重新确定的各聚类中心、各项电力数据重新进行聚类,确定至少一个目标聚类中心。
[0080]
本实施例的技术方案,通过综合考虑各待使用电力数据与每一个聚类电力数据之间的欧式距离、dtw距离,以及各待使用参考数据与每一个聚类电力数据相对应的待应用参
考数据之间的dtw距离,确定相对误差值,以相对误差值标准数据序列之间的相似性,提高相似度确定的准确性,进而达到提高聚类效果的技术效果。
[0081]
实施例三
[0082]
作为上述实施例的一可选实施例,为了使本领域技术人员进一步清楚本发明实施例的技术方案,给出具体的应用场景实例。具体的,可以参见下述具体内容。
[0083]
示例性的,参见图3,可以表示为训练得到卷积自编码器方法示意图,可以通过接收日负荷序列,作为一组待处理电力数据,用训练好的卷积自编码器cae对日负荷序列进行特征提取,实现负荷序列的降维,得到维度较低的特征序列。卷积自编码器cae具体为一个由输入层,隐含层,输出层所构成的神经网络,它通过编码和解码两个步骤使输入数据的重构误差达到最小,从而获得最佳的数据隐含层表达。假设有一组无标签的训练样本x={x1,x2,

,xn},输出为y={y1,y2,

,yn},cae的优化目的就是为了得到最近似输入的输出,即构造出最优的输入表达,从而实现特征提取。如卷积自编码器cae有k(k=1,

,n)个卷积核,每个卷积核由参数wk和bk组成,用hk表示卷积层,则hk=σ(x*wk+bk),θ={w,b}为卷积核参数集合,σ为激活函数,*为卷积运算。cae将得到的输出结果进行特征重构,可得到为参数集合,并且两个集合中的参数被限制为可以使用日负荷数据样本,作为训练样本数据训练cae网络,即训练待训练卷积自编码器,如输入的训练样本数据和最终特征重构出来的输出数据进行欧式距离比较,通过bp算法进行优化,计算得最优的θ和参数集合,测试调优确定cae的输出维数以及编码、解码层数等超参数。进一步的,在利用卷积自编码器cae对负荷序列进行特征提取的过程中,设初始输入层数i=1,可以将日负荷序列集输入到cae网络的第1层,进行特征提取,通过最小化稀疏成本函数确定并输出隐含层序列。判断i是否等于模型层数,若否,将输出的隐含层序列输入到cae网络的第i+1层,进而执行i=i+1,同第1层相同方法进行特征提取,输出隐含层序列,依此类推,直到i等于模型层数,即i到达cae网络模型层数,输出第i层的隐含层序列作为深层特征序列,即待使用电力数据集,用于后续的聚类。
[0084]
在上述方案的基础上,可以根据待使用电力数据集求出待使用参考数据集,以基于待使用参考数据反映趋势信息,如,设降维后得到的电力值序列为x=[x1,x2,

,xn],即待使用电力数据,xn为第n个电力值,参考值计算公式为其中x

为第i个电力值所对应的参考值,相应的,可以求出其长度为n-1的趋势序列x

=[x
′1,x
′2,

,x

n-1
],作为x=[x1,x2,

,xn]的待使用参考数据。
[0085]
在上述方案的基础上,可以使用k-means算法进行聚类,准备迭代,初始化设定聚类中心个数l和迭代次数i,得到l个初始聚类中心对应的矩阵c=[c1,c2,
…cl
]
t
。求出每组待使用电力数据和聚类中心数据的综合相似度,即相对误差值d
all
,将待使用电力数据归类到最相似(d
all
最小)的那一类中。例如,设有两个时间序列x=[x1,x2,

,xn]和y=[y1,y2,

,yn],它们之间的欧式距离d2(x,y)如下所示:
[0086][0087]
用dtw算法求出x和y之间的dtw距离d
dtw
(x,y),即第一距离,以及对应待使用参考
数据x

和y

的dtw距离d
dtw
(x

,y

),即第二距离,则相对误差值d
all
(x,y)如下所示:d
all
(x,y)=αd2(x,y)+βd
dtw
(x,y)+γd
dtw
(x

,y

),d
all
(x,y)越小,意味着相似度越高。α,β,γ为权重值,可用改进熵权法确定欧式距离、第一距离和第二距离对应的权重。若日负荷序列之间某种相似度衡量值相差越大,则其相应的熵值就会越小,蕴含的有效信息越多,相应的权重也会更大。进一步的,更新聚类中心矩阵,并判断是否要跳出循环。跳出循环后,得到聚类结果,如判断是否要跳出循环的指标为2次迭代后所得的聚类离散度|j
i+1-ji|满足|j
i+1-ji|<e(e为收敛极限值),其中j
i+1
表示第i+1次迭代后的聚类离散度,ji表示第i次迭代后的聚类离散度,其中,ji聚类离散度计算可以为:经过2次迭代后,得到的聚类中心曲线不再发生变化,可以停止迭代。否则就要一直迭代至迭代次数已满或聚类离散度不再发生变化。
[0088]
在上述方案的基础上,k-means聚类质量的评价指标为dbi指标,即相似度均值,计算相似度均值i
dbi
的公式如下所示:
[0089][0090][0091]
其中,i
dbi
表示为相似度均值,r
wq
表示第w类和第q类聚类中心数据的待使用相似度;sw表示第w类聚类中心中数据的簇内聚拢度,sq表示第q类聚类中心中数据的簇内聚拢度;m
wq
为第w类中心与第q类聚类中心中数据点的簇间分散度。可以当相似度均值小于预设阈值,认为聚类结果合格,可以基于此时的目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别;或,当相似度均值未小于预设阈值,认为聚类结果不合格,可以调整当前已有的聚类中心的数量,以使基于调整后的数量,重新确定与数量相对应的聚类中心,重新进行聚类。
[0092]
本实施例的技术方案,通过获取各用电设备所对应的至少一组待处理电力数据;其中,待处理电力数据中包括电力值序列;基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别,解决了现有技术中基于k-means算法对多组数据序列进行聚类,导致聚类效率低的问题,实现了通过利用卷积自编码器对各待处理电力数据降维处理,得到高表达性、降维后的待使用电力数据,在保证聚类精度的同时,提高聚类计算效率。
[0093]
实施例四
[0094]
图4是根据本发明实施例四提供的一种数据处理装置的结构示意图。如图4所示,该装置包括:待处理电力数据获取模块410、待使用电力数据确定模块420和目标聚类中心确定模块430。
[0095]
其中,待处理电力数据获取模块410,用于获取各用电设备所对应的至少一组待处理电力数据;其中,所述待处理电力数据中包括电力值序列;待使用电力数据确定模块420,用于基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;目标聚类中心确定模块430,用于基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别。
[0096]
本实施例的技术方案,通过获取各用电设备所对应的至少一组待处理电力数据;其中,待处理电力数据中包括电力值序列;基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别,解决了现有技术中基于k-means算法对多组数据序列进行聚类,导致聚类效率低的问题,实现了通过利用卷积自编码器对各待处理电力数据降维处理,得到高表达性、降维后的待使用电力数据,在保证聚类精度的同时,提高聚类计算效率。
[0097]
在上述装置的基础上,可选的,所述目标聚类中心确定模块430,包括相对误差值确定单元、待使用聚类中心确定单元和目标聚类中心确定单元。
[0098]
相对误差值确定单元,用于分别确定各待使用电力数据与当前已有的聚类中心所对应的聚类电力数据的相对误差值;
[0099]
待使用聚类中心确定单元,用于根据各待使用电力数据所对应的至少一个相对误差值,确定各待使用电力数据所关联的待使用聚类中心;
[0100]
目标聚类中心确定单元,用于基于与所述待使用聚类中心相关联的关联电力数据,确定新的聚类中心,并将所述新的聚类中心作为当前已有的聚类中心,以在下次获取到待使用电力数据时,重新基于待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,直至聚类离散差值小于预设差值时结束,得到至少一个目标聚类中心;
[0101]
其中,所述聚类离散差值是基于当前已有的聚类中心和上一次已有的聚类中心的聚类离散度确定的,所述聚类离散度是基于聚类中心的聚类电力数据和与聚类中心相关联的关联电力数据确定的。
[0102]
在上述装置的基础上,可选的,所述装置还包括待使用参考数据确定模块,所述待使用参考数据确定模块包括参考值确定单元和待使用参考数据确定单元。
[0103]
参考值确定单元,用于针对各待使用电力数据,基于当前待使用电力数据中当前电力值、后一电力值和时间间隔,确定所述当前电力值对应的参考值;其中,所述当前电力值的接收时刻早于所述后一电力值的接收时刻;
[0104]
待使用参考数据确定单元,用于将相应待使用电力数据所对应的各参考值,作为与所述相应待使用电力数据相对应的待使用参考数据。
[0105]
在上述装置的基础上,可选的,所述相对误差值确定单元,包括欧式距离确定子单元、第一距离确定子单元、第二距离确定子单元和相对误差值确定子单元。
[0106]
欧式距离确定子单元,用于确定各待使用电力数据与每一个聚类电力数据之间的欧式距离;
[0107]
第一距离确定子单元,用于利用动态时间归整算法确定各待使用电力数据与每一个聚类电力数据的之间的第一距离;
[0108]
第二距离确定子单元,用于利用动态时间归整算法确定各待使用参考数据与每一个聚类电力数据相对应的待应用参考数据之间的第二距离;
[0109]
相对误差值确定子单元,用于基于所述欧式距离、第一距离和第二距离,以及相应的权重值,确定所述相对误差值。
[0110]
在上述装置的基础上,可选的,所述装置还包括卷积自编码器确定模块,所述卷积自编码器确定模块包括训练样本数据确定单元、输出数据确定单元、模型训练单元和模型确定单元。
[0111]
训练样本数据确定单元,用于获取多个训练样本数据;所述训练样本数据中包括用电设备的电力参数;
[0112]
输出数据确定单元,用于针对各训练样本数据,将当前训练样本数据作为待训练卷积自编码器的输入,得到所述当前训练样本数据所对应的输出数据;
[0113]
模型训练单元,用于根据所述输出数据和相应训练样本数据训练所述待训练卷积自编码器;
[0114]
模型确定单元,用于将所述待训练卷积自编码器中的损失函数收敛作为训练目标,得到卷积自编码器。
[0115]
在上述装置的基础上,可选的,所述装置还包括中心数量更新模块,所述中心数量更新模块包括目标相似度确定单元、相似度均值确定单元和中心数量调整单元。
[0116]
目标相似度确定单元,用于针对所述至少一个目标聚类中心,确定当前目标聚类中心与其余各目标聚类中心所对应的待使用相似度,并将最大待使用相似度作为目标相似度;
[0117]
相似度均值确定单元,用于基于各目标相似度,确定相似度均值;
[0118]
中心数量调整单元,用于若所述相似度均值小于预设阈值,则基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别;或,若所述相似度均值未小于预设阈值,则调整当前已有的聚类中心的数量,以使基于调整后的数量,重新确定与所述数量相对应的聚类中心,以及使基于重新确定的各聚类中心、历史聚类数据以及待使用电力数据,确定至少一个目标聚类中心。
[0119]
在上述装置的基础上,可选的,所述目标聚类中心确定模块430,还包括电力分布曲线确定单元和用电类别确定单元。
[0120]
电力分布曲线确定单元,用于确定隶属于同一目标聚类中心的待分析电力数据所对应的电力分布曲线;
[0121]
用电类别确定单元,用于根据各电力分布曲线上的电力波动信息,确定与所述目标聚类中心相对应的用电类别。
[0122]
本发明实施例所提供的数据处理装置可执行本发明任意实施例所提供的数据处理方法,具备执行方法相应的功能模块和有益效果。
[0123]
实施例五
[0124]
图5是实现本发明实施例的数据处理方法的电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0125]
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0126]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0127]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如数据处理方法。
[0128]
在一些实施例中,数据处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
[0129]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0130]
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在
机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0131]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0132]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0133]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0134]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0135]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0136]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

技术特征:
1.一种数据处理方法,其特征在于,包括:获取各用电设备所对应的至少一组待处理电力数据;其中,所述待处理电力数据中包括电力值序列;基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别。2.根据权利要求1所述的方法,其特征在于,所述基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,包括:分别确定各待使用电力数据与当前已有的聚类中心所对应的聚类电力数据的相对误差值;根据各待使用电力数据所对应的至少一个相对误差值,确定各待使用电力数据所关联的待使用聚类中心;基于与所述待使用聚类中心相关联的关联电力数据,确定新的聚类中心,并将所述新的聚类中心作为当前已有的聚类中心,以在下次获取到待使用电力数据时,重新基于待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,直至聚类离散差值小于预设差值时结束,得到至少一个目标聚类中心;其中,所述聚类离散差值是基于当前已有的聚类中心和上一次已有的聚类中心的聚类离散度确定的,所述聚类离散度是基于聚类中心的聚类电力数据和与聚类中心相关联的关联电力数据确定的。3.根据权利要求2所述的方法,其特征在于,在所述确定各待使用电力数据与当前已有的聚类中心所对应的聚类电力数据的相对误差值之前,还包括:针对各待使用电力数据,基于当前待使用电力数据中当前电力值、后一电力值和时间间隔,确定所述当前电力值对应的参考值;其中,所述当前电力值的接收时刻早于所述后一电力值的接收时刻;将相应待使用电力数据所对应的各参考值,作为与所述相应待使用电力数据相对应的待使用参考数据。4.根据权利要求2或3所述的方法,其特征在于,所述确定各待使用电力数据与当前已有的聚类中心所对应的聚类电力数据的相对误差值,包括:确定各待使用电力数据与每一个聚类电力数据之间的欧式距离;利用动态时间归整算法确定各待使用电力数据与每一个聚类电力数据的之间的第一距离;利用动态时间归整算法确定各待使用参考数据与每一个聚类电力数据相对应的待应用参考数据之间的第二距离;基于所述欧式距离、第一距离和第二距离,以及相应的权重值,确定所述相对误差值。
5.根据权利要求1所述的方法,其特征在于,还包括:训练得到卷积自编码器;其中,所述训练得到卷积自编码器,包括:获取多个训练样本数据;所述训练样本数据中包括用电设备的电力参数;针对各训练样本数据,将当前训练样本数据作为待训练卷积自编码器的输入,得到所述当前训练样本数据所对应的输出数据;根据所述输出数据和相应训练样本数据训练所述待训练卷积自编码器;将所述待训练卷积自编码器中的损失函数收敛作为训练目标,得到卷积自编码器。6.根据权利要求1所述的方法,其特征在于,在所述基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心之后,还包括:针对所述至少一个目标聚类中心,确定当前目标聚类中心与其余各目标聚类中心所对应的待使用相似度,并将最大待使用相似度作为目标相似度;基于各目标相似度,确定相似度均值;若所述相似度均值小于预设阈值,则基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别;或,若所述相似度均值未小于预设阈值,则调整当前已有的聚类中心的数量,以使基于调整后的数量,重新确定与所述数量相对应的聚类中心,以及使基于重新确定的各聚类中心、历史聚类数据以及待使用电力数据,确定至少一个目标聚类中心。7.根据权利要求1所述的方法,其特征在于,所述基于相应目标聚类中心所对应的聚类电力数据,确定与所述目标聚类中心相对应的用电类别,包括:确定隶属于同一目标聚类中心的待分析电力数据所对应的电力分布曲线;根据各电力分布曲线上的电力波动信息,确定与所述目标聚类中心相对应的用电类别。8.一种数据处理装置,其特征在于,包括:待处理电力数据获取模块,用于获取各用电设备所对应的至少一组待处理电力数据;其中,所述待处理电力数据中包括电力值序列;待使用电力数据确定模块,用于基于预先训练的卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;目标聚类中心确定模块,用于基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与所述目标聚类中心相对应的用电类别。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的数据处理方法。

技术总结
本发明公开了一种数据处理方法、装置、电子设备及存储介质。该方法包括:获取各用电设备所对应的至少一组待处理电力数据;基于卷积自编码器对各待处理电力数据降维处理,得到各待处理电力数据所对应的待使用电力数据;基于各待使用电力数据、当前已有的聚类中心和相应的聚类电力数据,更新当前已有的聚类中心以及相应的聚类电力数据,以得到更新后的至少一个目标聚类中心,以及使基于相应目标聚类中心所对应的关联电力数据,确定与目标聚类中心相对应的用电类别。解决了现有技术中基于K-means算法对多组数据序列进行聚类,导致聚类效率低的问题,实现在保证聚类精度的同时,达到提高聚类计算效率的效果。聚类计算效率的效果。聚类计算效率的效果。


技术研发人员:尹善耀 谢林翰 刘静云 王琪 黄熙杰 肖毅 叶子程 陈成
受保护的技术使用者:广东电网有限责任公司惠州供电局
技术研发日:2022.07.25
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-1692.html

最新回复(0)