一种电网数据隐私保护方法及系统与流程

专利2023-07-23  106



1.本发明涉及电网数据保护技术领域,尤其涉及一种基于同态加密与联邦学习的电网数据隐私保护方法及系统。


背景技术:

2.目前,对电力系统各方面的需求在不断提高,智能化进程也在不断推进,这也致使电网数据的规模增大、运行速度提升、数据多样化。根据数据来源的不同,可以将智能电网大数据分为电力企业内部数据和电力企业外部数据。电力企业内部数据源主要包括广域量测系统、数据采集与监控系统、在线监测系统、用电信息采集系统、生产管理系统、配电管理系统、客户服务系统等;电力企业外部数据源包括气象信息系统、地理信息系统、互联网数据、公共服务部门数据、社会经济数据等。这些数据分散放置在不同地方,由不同单位/部门管理,具有分散放置、分布管理的特性。
3.隐私计算技术是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术体系,达到对数据“可用、不可见”的目的,在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。从技术角度出发,隐私计算是涵盖众多学科的交叉融合技术,目前主流的隐私计算技术主要分为三大方向:第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。
4.现有技术中电力系统依赖集中式的方式训练模型,要求训练涉及的多方数据和训练过程必须在数据中心。这些模型有的用来进行负荷/功率预测以及用电量预测,有的针对计量装置参数进行预测与推演,有的则是对电网系统进行规划与评估以及电费回收问题的分析,还有针对计量装置的故障诊断等。此外,在电力计量系统用户画像的研究中,需要收集各种各样的用户数据,再将外部数据、企业内部的客户数据、业务工单中的信息等加以整合和分析。在这一过程中各参与方自有数据中的隐私信息可能会被泄露。甚至还可能被不法分子利用而威胁到企业信息安全、电力计量系统安全以及国家基础设施安全等。
5.此外,各参与方出于数据安全和隐私保护或其他政策合规的需求,无法将自有数据上传到数据中心。因此,如何在确保各方数据安全和隐私的情况下打破数据孤岛、共同训练模型,成为了急需解决的挑战。


技术实现要素:

6.本发明提供一种电网数据隐私保护方法,方法可以有效保护电网数据隐私和安全。
7.方法包括:
8.步骤一、电网部门终端将本地数据储存于本地数据库中;
9.步骤二、电网部门终端从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;
10.步骤三、电网部门终端使用本地数据库训练局部模型参数梯度;
11.步骤四、电网部门终端采用加法同态的paillier算法加密技术对局部模型的参数梯度进行加密,并将加密后的局部模型参数梯度上传到中心服务器;
12.步骤五、中心服务器对局部模型参数梯度聚合计算,更新全局模型的参数梯度;
13.步骤六、中心服务器将更新后全局模型的参数梯度发送给各个电网部门终端;
14.步骤七、各个电网部门终端使用接收到的全局模型参数梯度更新本地局部模型的参数梯度。
15.进一步需要说明的是,步骤七之后还包括:中心服务器评估更新后的全局模型参数梯度性能;
16.若性能未达到预设条件,则开启下一轮联邦学习,重复执行步骤三至七,直至性能达到预设条件;预设条件为全局模型收敛,或训练过程达到最大迭代次数,或达到最长训练时间。
17.当性能达到预设条件时,训练终止,联邦学习结束。
18.进一步需要说明的是,基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认各个电网部门终端为共有用户。
19.进一步需要说明的是,方法中的电网部门终端包括:电网部门终端a和电网部门终端b;
20.电网部门终端a的数据集和电网部门终端b的数据集为和
21.电网部门终端a的特征和电网部门终端b的特征相对应的lr的模型参数分别为θa与θb;训练lr的目标函数为:
[0022][0023]

[0024][0025][0026][0027][0028][0029]
那么目标函数表示为:
[0030]
l=la+lb+l
ab
.
[0031]
梯度分别可以表示为:
[0032][0033]
进一步需要说明的是,各电网部门终端可评估各自建模共享,建模代价,建模期望损失,建模时间期望损失的收益与损失,并协调奖励策略。奖励策略是依据贡献公平性、期
望损失分配公平性、期望公平性的原则,达到各方共享模型收益,实现各方共享模型收益的策略。
[0034]
本发明还提供一种电网数据隐私保护系统,系统包括:设置在各个电力部门的电网部门终端以及中心服务器;
[0035]
各个电力部门设置有本地数据库;
[0036]
电网部门终端用于将本地数据储存于本地数据库中,还从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;
[0037]
使用本地数据库训练局部模型参数梯度;
[0038]
采用加法同态的paillier算法加密技术对局部模型的参数梯度进行加密,并将加密后的局部模型参数梯度上传到中心服务器;
[0039]
以及电网部门终端还用于使用接收到的全局模型参数梯度更新本地局部模型的参数梯度;
[0040]
中心服务器用于对局部模型参数梯度聚合计算,更新全局模型的参数梯度;还将更新后全局模型的参数梯度发送给各个电网部门终端。
[0041]
进一步需要说明的是,中心服务器还用于评估更新后的全局模型参数梯度性能;
[0042]
若性能未达到预设条件,则开启下一轮联邦学习,重复执行电网数据隐私保护方法步骤,直至性能达到预设条件;
[0043]
当性能达到预设条件时,训练终止,联邦学习结束。
[0044]
进一步需要说明的是,中心服务器还基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认各个电网部门终端为共有用户。
[0045]
从以上技术方案可以看出,本发明具有以下优点:
[0046]
本发明提供的同态加密与联邦学习的电网数据隐私保护方法及系统由于多方数据的用户群体并非完全重合,利用基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户。以便联合这些用户的特征进行建模。
[0047]
本发明满足各参与方通过电网部门终端基于数据安全和隐私保护的需求。并且系统可以保证各方数据安全和隐私的情况,并解决数据孤岛和数据安全问题,保证了电网数据的安全性。
[0048]
本发明提供的同态加密与联邦学习的电网数据隐私保护方法维持了数据联邦的稳定性,并且在以后逐渐吸引更多高质量的参与方加入,使各个参与方具有公平性,并且适合联邦学习环境的激励机制,各参与方可评估各自建模共享,建模代价,建模期望损失,建模时间期望损失等等方面的收益与损失,协调奖励策略。
[0049]
基于本发明提供的同态加密与联邦学习的电网数据隐私保护方法可以有效保护电网数据隐私和安全,又能充分合规的利用多方数据,解决电网数据孤岛和数据安全问题。提高模型准确性和学习任务完成时间。本方法引入了联邦学习激励机制,保证了该方法的公平性。
附图说明
[0050]
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单
地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0051]
图1为电网数据隐私保护系统示意图;
[0052]
图2为电网数据隐私保护方法流程图;
[0053]
图3为电网数据隐私保护方法实施例流程图。
具体实施方式
[0054]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055]
本发明提供一种电网数据隐私保护系统;系统是基于同态加密和联邦学习来执行,同态加密是基于数学难题的计算复杂性理论的一种数据加密方式,通常为非对称性加密。其特点是对使用同态加密的明密文,对密文直接进行处理,跟对明文进行处理再加密,得到的结果相同。从代数的角度讲,即同态性。
[0056]
联邦学习是隐私计算的一类技术路线,它本质是一种分布式机器学习技术和系统,包括两个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方数据不出本地的情况下联合多方数据源建模和提供模型推理与预测服务。在联邦学习框架下,各参与方只交换密文形式的中间计算结果或转化结果,不交换数据,保证各方数据不露出,使得构建的全局模型既能确保用户隐私,又能充分利用多方数据,是解决数据孤岛和数据安全问题的重要框架,其强调的核心理念是“数据不动模型动,数据可用不可见”。
[0057]
本发明提供的电网数据隐私保护系统可以包括设置在各个电力部门的电网部门终端,网络和中心服务器。网络是用以在电网部门终端和中心服务器之间提供通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0058]
应该理解,图1中的终端设备、网络和中心服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和中心服务器。比如中心服务器可以是多个服务器组成的服务器集群等。
[0059]
用户可以使用电网部门终端通过网络与中心服务器交互,以接收或发送消息等。电网部门终端可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
[0060]
中心服务器可以是提供各种服务的服务器。例如用户利用电网部门终端向中心服务器发送本地数据,或者局部模型参数梯度。中心服务器可以对电网部门终端发送的数据进行处理。
[0061]
需要说明的是,电网部门终端可以包括中央处理单元(cpu,central processing unit),其可以根据存储在只读存储器(rom,read-only memory)中的程序或者从储存部分加载到随机访问存储器(ram,random access memory)中的程序而执行各种适当的动作和处理。在ram中,还存储有系统操作所需的各种程序和数据。cpu、rom以及ram通过总线彼此相连。输入/输出(i/o)接口也连接至总线。
[0062]
以下部件连接至i/o接口:包括键盘、鼠标等的输入部分;包括液晶显示器(lcd,
liquid crystal display)等以及扬声器等的输出部分。
[0063]
对于本发明涉及的系统中,各个电力部门设置有本地数据库;
[0064]
电网部门终端用于将本地数据储存于本地数据库中,还从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;
[0065]
使用本地数据库训练局部模型参数梯度;
[0066]
采用加法同态的paillier算法加密技术对局部模型的参数梯度进行加密,并将加密后的局部模型参数梯度上传到中心服务器;
[0067]
以及电网部门终端还用于使用接收到的全局模型参数梯度更新本地局部模型的参数梯度;
[0068]
中心服务器用于对局部模型参数梯度聚合计算,更新全局模型的参数梯度;还将更新后全局模型的参数梯度发送给各个电网部门终端。
[0069]
中心服务器还用于评估更新后的全局模型参数梯度性能;若性能未达到预设条件,则开启下一轮联邦学习,重复执行电网数据隐私保护方法步骤,直至性能达到预设条件;当性能达到预设条件时,训练终止,联邦学习结束。
[0070]
中心服务器还基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认各个电网部门终端为共有用户。
[0071]
这样,基于同态加密与联邦学习的电网数据隐私保护系统中,电网各部门或各方数据平台使用自有数据库在本地训练自己的局部模型;然后将局部模型的参数经加密后上传汇总到中心服务器进行参数聚合计算,更新全局模型;最后,各部门将更新后的全局模型参数下载到本地,并更新本地模型。整个过程迭代进行直至本地模型的性能收敛并满足预设条件之后,分布式的训练模型过程结束。
[0072]
由于多方数据的用户群体并非完全重合,系统利用基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户。以便联合这些用户的特征进行建模。
[0073]
本发明满足各参与方通过电网部门终端基于数据安全和隐私保护的需求。并且系统可以保证各方数据安全和隐私的情况,并解决数据孤岛和数据安全问题,保证了电网数据的安全性。
[0074]
基于上述系统,本发明还提供一种电网数据隐私保护方法,方法的相关技术中,例如可以采用机器学习方法、深度学习方法等电网数据隐私保护方法。
[0075]
本发明提供的电网数据隐私保护方法利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。也就是说本发明涉及的电网数据隐私保护方法具有机器学习功能。其中,机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
[0076]
本发明提供的电网数据隐私保护方法利用了机器学习和深度学习,具体可以包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
[0077]
本技术涉及的机器学习技术具体通过如下实施例进行说明:本技术实施例提供的
数据发送方法和数据接收方法,可以应用于接收端和发送端。其中,接收端通过网络与发送端进行通信。接收端和发送端可以是计算机设备,计算机设备具体可以是终端,也可以是服务器。
[0078]
图2和3示意性示出了根据本公开的一实施方式的一种电网数据隐私保护方法的流程图。本公开实施方式的方法步骤可以由电网部门终端以及中心服务器交互执行。方法包括:
[0079]
s101、电网部门终端将本地数据储存于本地数据库中;
[0080]
s102、电网部门终端从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;
[0081]
s103、电网部门终端使用本地数据库训练局部模型参数梯度;
[0082]
s104、电网部门终端采用加法同态的paillier算法加密技术对局部模型的参数梯度进行加密,并将加密后的局部模型参数梯度上传到中心服务器;
[0083]
s105、中心服务器对局部模型参数梯度聚合计算,更新全局模型的参数梯度;
[0084]
s106、中心服务器将更新后全局模型的参数梯度发送给各个电网部门终端;
[0085]
s107、各个电网部门终端使用接收到的全局模型参数梯度更新本地局部模型的参数梯度。之后中心服务器评估更新后的全局模型参数梯度性能;
[0086]
s108、当性能达到预设条件时,训练终止,联邦学习结束。
[0087]
若性能未达到预设条件,则开启下一轮联邦学习,重复执行步骤三至七,直至性能达到预设条件。预设条件为全局模型收敛,或训练过程达到最大迭代次数,或达到最长训练时间。
[0088]
在本发明的一种实施例中,以下将给出一种可能的实施例对其具体的实施方案进行非限制性阐述。
[0089]
为了描述方便,本发明各参与方的各电网部门终端设为电网部门终端a,电网部门终端b,中心服务器设为c,如有更多参与方同理。假设电网部门终端a和电网部门终端b的数据集分别为与其特征相对应的lr的模型参数分别为θa与θb。那么训练lr的目标函数为:
[0090][0091]

[0092][0093][0094][0095][0096][0097]
那么目标函数可以表示为:
[0098]
l=la+lb+l
ab
.
[0099]
梯度分别可以表示为:
[0100][0101]
由于多方数据的用户群体并非完全重合,系统利用基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户。以便联合这些用户的特征进行建模。
[0102]
电网部门终端a和电网部门终端b使用自有数据库对初始化后的模型进行本地训练。
[0103]
由于下一个步骤参数聚合过程只涉及加法和乘法,故本发明将使用无需多项式近似的加法同态的paillier算法加密技术对梯度参数进行加密。电网部门终端a和电网部门终端b使用同态加密技术对梯度信息进行掩饰,并将掩饰后的结果(简称加密梯度)发送给中心服务器c以待进行聚合操作。使用同态加密可以增强该方法对数据安全的保护。下为具体过程。[[*]]表示对*同态加密,a-》b:x表示a向b发送数据x。
[0104]
a-》b:和[[la]]
[0105]
b-》a:[[di]]
[0106]
b-》c:[[l]]
[0107]
a-》c:ra为a初始化的随机数
[0108]
b-》c:rb为b初始化的随机数
[0109]
中心服务器进行安全聚合操作,之后将聚合后的结果最新梯度信息发送给各参与方。具体如下
[0110]
c:解密l
[0111]
c-》a:
[0112]
c-》b:
[0113]
电网部门终端a和电网部门终端b分别从中心服务器下载聚合后的全局模型参数梯度,并对收到的梯度进行解密,之后使用解密后的梯度结果更新各自本地的局部模型参数。即电网部门终端a更新θa,电网部门终端b更新θb。同时中心服务器c评估更新后的模型性能,若性能未达到要求就开启下一轮联邦学习,重复上述步骤,当性能足够好时,训练终止,联邦学习结束。
[0114]
系统的性能要求,可以根据系统的运行状态进行设置,具体设置方式这里不做限定。
[0115]
本发明维持了数据联邦的稳定性,并且在以后逐渐吸引更多高质量的参与方加入,使各个参与方具有公平性,并且适合联邦学习环境的激励机制,各参与方可评估各自建模共享,建模代价,建模期望损失,建模时间期望损失等等方面的收益与损失,协调奖励策略。
[0116]
基于本发明提供的同态加密与联邦学习的电网数据隐私保护方法可以有效保护电网数据隐私和安全,又能充分合规的利用多方数据,解决电网数据孤岛和数据安全问题。
[0117]
本方法是基于同态加密的联邦学习架构,解决了联邦学习缺少数据安全性保护的不足,在解决数据孤岛问题的基础上,保证了电网数据的安全性。
[0118]
提高模型准确性和学习任务完成时间。本方法引入了联邦学习激励机制,保证了该方法的公平性。
[0119]
本发明提供的同态加密与联邦学习的电网数据隐私保护方法是结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0120]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种电网数据隐私保护方法,其特征在于,方法包括:步骤一、电网部门终端将本地数据储存于本地数据库中;步骤二、电网部门终端从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;步骤三、电网部门终端使用本地数据库训练局部模型参数梯度;步骤四、电网部门终端采用加法同态的paillier算法加密技术对局部模型的参数梯度进行加密,并将加密后的局部模型参数梯度上传到中心服务器;步骤五、中心服务器对局部模型参数梯度聚合计算,更新全局模型的参数梯度;步骤六、中心服务器将更新后全局模型的参数梯度发送给各个电网部门终端;步骤七、各个电网部门终端使用接收到的全局模型参数梯度更新本地局部模型的参数梯度。2.根据权利要求1所述的电网数据隐私保护方法,其特征在于,步骤七之后还包括:中心服务器评估更新后的全局模型参数梯度性能;若性能未达到预设条件,则开启下一轮联邦学习,重复执行步骤三至七,直至性能达到预设条件;当性能达到预设条件时,训练终止,联邦学习结束。3.根据权利要求1所述的电网数据隐私保护方法,其特征在于,基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认各个电网部门终端为共有用户。4.根据权利要求1所述的电网数据隐私保护方法,其特征在于,方法中的电网部门终端包括:电网部门终端a和电网部门终端b;电网部门终端a的数据集和电网部门终端b的数据集为和电网部门终端a的特征和电网部门终端b的特征相对应的lr的模型参数分别为θ
a
与θ
b
;训练lr的目标函数为:令令令令令令那么目标函数表示为:l=l
a
+l
b
+l
ab
.梯度分别可以表示为:
5.根据权利要求1所述的电网数据隐私保护方法,其特征在于,各电网部门终端可评估各自建模共享,建模代价,建模期望损失,建模时间期望损失的收益与损失,并协调奖励策略。6.一种电网数据隐私保护系统,其特征在于,系统采用如权利要求1至5任意一项所述的电网数据隐私保护方法;系统包括:设置在各个电力部门的电网部门终端以及中心服务器;各个电力部门设置有本地数据库;电网部门终端用于将本地数据储存于本地数据库中,还从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;使用本地数据库训练局部模型参数梯度;采用加法同态的paillier算法加密技术对局部模型的参数梯度进行加密,并将加密后的局部模型参数梯度上传到中心服务器;以及电网部门终端还用于使用接收到的全局模型参数梯度更新本地局部模型的参数梯度;中心服务器用于对局部模型参数梯度聚合计算,更新全局模型的参数梯度;还将更新后全局模型的参数梯度发送给各个电网部门终端。7.根据权利要求6所述的电网数据隐私保护系统,其特征在于,中心服务器还用于评估更新后的全局模型参数梯度性能;若性能未达到预设条件,则开启下一轮联邦学习,重复执行电网数据隐私保护方法步骤,直至性能达到预设条件;当性能达到预设条件时,训练终止,联邦学习结束。8.根据权利要求6所述的电网数据隐私保护系统,其特征在于,中心服务器还基于加密的用户样本对齐技术,在各数据来源不公开各自数据的前提下确认各个电网部门终端为共有用户。

技术总结
本发明提供一种电网数据隐私保护方法及系统,涉及电网数据保护技术领域,电网部门终端将本地数据储存于本地数据库中;从本地数据库提取数据,并作为数据样本,再将数据样本进行对齐;使用本地数据库训练局部模型参数梯度;采用加法同态的加密技术对局部模型的参数梯度进行加密,并参数上传到中心服务器;中心服务器对局部模型参数梯度聚合计算,更新全局模型的参数梯度;发送给各个电网部门终端;各个电网部门终端使用接收到的全局模型参数梯度更新本地局部模型的参数梯度。当性能达到预设条件时,训练终止。本发明有效保护电网数据隐私和安全,又能充分合规的利用多方数据,解决电网数据孤岛和数据安全的问题。决电网数据孤岛和数据安全的问题。决电网数据孤岛和数据安全的问题。


技术研发人员:高紫婷 付成花 刘泽三 李晓珍
受保护的技术使用者:国网信息通信产业集团有限公司
技术研发日:2022.06.24
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-4096.html

最新回复(0)