1.本发明属于信息安全技术领域,尤其涉及一种应用于金融场景的隐私集合求交方法与系统。
背景技术:2.在当前的金融场景中,如果多家公司想要实现数据建模,则需要将数据样本汇集到某一中心节点或某一参与方,求出交集部分后进行数据对齐,然后进行数据建模。如金融公司a和支付公司b进行信用卡营销模型的建模,传统实现方式一般有:中心化机构建模和数据参与方建模。
3.中心化机构建模,这种方式数据提供和营销模型的投放都需要经过层层审核,效率低下。在求交的过程中可能出现非重合数据较多的情况,需要处理大量无效数据,且双方公司都提供了额外的数据给数据建模机构,数据安全与安全合规上存在一定问题。
4.数据提供方建模,这种流程公司a可能有全量库被碰撞的可能,造成数据隐私泄漏。
5.因现有技术存在数据泄漏、效率低下等安全合规问题,因此需要有一种系统能够满足a和b在整个营销过程自始至终都在一个平台上(隐私计算平台,a和b本地各有一个计算节点,a和b需要协同计算的数据都只存在本地节点上)。在这种场景中,隐私集合求交技术可以实现在跨机构建模过程中,各个参与方只能获取交集部分的id,再通过匹配内部的特征数据,来发起模型训练任务。目前,在基于联邦学习或多方安全计算技术的联邦建模方案中,隐私集合求交技术已经被认为是必不可少的前置步骤。综上本发明提出一种应用于金融场景的隐私集合求交方法与系统。
技术实现要素:6.本发明实施例提供一种应用于金融场景的隐私集合求交方法与系统,通过已有文献指出的基于sm2的无证书签名体系在私钥提取阶段仍然使用schnorr签名,现有的基于sm2签名的无证书密钥生成方法的计算步骤与sm2不相符,基于sm2的无证书多接收者加密方法尚未提出而本方案可弥补这一缺陷;可解决已有的基于sm2签名的无证书密钥生成方法中,签名的步骤与sm2不一致的问题。
7.本发明实施例是这样实现的,一种应用于金融场景的隐私集合求交方法,包括;
8.步骤1,任务发起,由任务中心对参与双方发起psi任务;
9.步骤2,建立通讯,参与方收到任务信息后,各自计算节点与对方建立通信;
10.步骤3,通过psi技术求得双方交集;
11.步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存;
12.步骤5,返回执行任务结果,将保存结果反馈到任务中心。
13.作为本发明的一种优选方案,其中,在本方法中参与方只能知道和对方有交集部分的数据id,然后双方根据交集的结果进行数据对齐、建模。
14.作为本发明的一种优选方案,其中,步骤1,任务发起,由任务中心对参与方发起psi任务中的参与方包括:供方sender和需方receiver;
15.且供方sender:有n条数据,{(sid1),...,(sidn)};
16.需方receiver:有m条数据,{(rid1),...,(ridm)};
17.其中供方sender和需方receivr分别对应两个不同的金融公司。
18.作为本发明的一种优选方案,其中,所述步骤1-步骤5中系统公开参数包括:
19.密码学hash函数:h
20.循环群g以及其素数阶q。
21.作为本发明的一种优选方案,其中,所述步骤3,通过psi技术求得双方交集的算法过程如下;
22.f)sender本地选取随机数x∈z
q,
,然后计算h(sidi)
x
,i=1,...,n,并发送给receiver;
23.g)receiver本地选取随机数y∈z
q,
,然后计算h(ridi)y,i=1,...,m,并发送给sender;
24.h)sender接收receiver发送过来的h(ridi)y,i=1,...,m;随后sender计算(h(ridi)y)
x
,i=1,...,m;并发送给receiver;
25.i)receiver接受sender发送过来的h(sidi)
x
,i=1,...,n;随后receiver计算(h(sidi)
x
)y,i=1,...,n;并发送给sender;
26.j)receiver和sender分别在本地计算:(h(sidi)
x
)y,i=1,...,n与(h(ridi)y)
x
,i=1,...,m两个集合的交集,并输出该交集对应的id值。
27.作为本发明的一种优选方案,其中,所述步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存中的交集结果由receiver和sender分别输出id交集。
28.作为本发明的一种优选方案,其中,所述步骤5返回执行任务结果,将保存结果反馈到任务中心,区分为三种情况:
29.供方保存结果,需方不保存结果;
30.需方保存结果,供方不保存结果;
31.两个参与方共同保存结果。
32.一种应用于金融场景的隐私集合求交系统,包括:调度平台、计算节点和数据节点;
33.调度平台,所述调度平台用于负责任务调度;
34.计算节点,所述计算节点设置在金融企业内部,用于执行交集计算;
35.数据节点,所述数据节点设置在金融企业内部,且与计算节点连接,数据节点用于存储各自计算数据。
36.作为本发明的一种优选方案,其中,所述调度平台经双方协商后部署在任意位置,可布置在某一参与方内部或其他服务器上。
37.作为本发明的一种优选方案,其中,所述计算节点中交集计算基于椭圆曲线的dh-basic-psi。
38.本发明的有益效果:通过基于隐私集合求交的隐私计算平台,能够在不获取其他参与方数据的前提下完成双方的数据(id)求交;相比现有技术体系和实现模式,通过隐私
集合求交方式更加确保了数据安全和政策合规,在保证各参与方对各自数据的强拥有权前提下,深度植入到业务场景中,发挥它应该承担的历史使命。
附图说明
39.图1是本发明的隐私计算平台系统部署图;
40.图2是本发明的广播加密与广播解密阶段原理图;
41.图3是本发明的计算计算平台执行psi任务框图。
具体实施方式
42.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
43.本发明实现了一个隐私计算平台系统(以下简称“隐私计算平台”),在不泄漏双方数据的前提下完成对双方数据的求交,避免了数据安全问题与合规问题;本算法(两方安全匹配)用于在两个参与方之间计算出共同的数据交集,并且发起方(其中的一个参与方)可以获得交集结果,协作方(另一个参与方)无法获得任何信息,以及可灵活适配为双方均可获得交集信息。此外,任何一方都无法获得另一方除了交集信息之外的其他信息。通过基于隐私集合求交的隐私计算平台,能够在不获取其他参与方数据的前提下完成双方的数据(id)求交。相比现有技术体系和实现模式,通过隐私集合求交方式更加确保了数据安全和政策合规,在保证各参与方对各自数据的强拥有权前提下,深度植入到业务场景中,发挥它应该承担的历史使命。
44.本发明实施例是这样实现的,一种应用于金融场景的隐私集合求交方法,包括;
45.步骤1,任务发起,由任务中心对参与双方发起psi任务;
46.步骤2,建立通讯,参与方收到任务信息后,各自计算节点与对方建立通信;
47.步骤3,通过psi技术求得双方交集;
48.步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存;
49.步骤5,返回执行任务结果,将保存结果反馈到任务中心。
50.进一步的,在本方法中参与方只能知道和对方有交集部分的数据id,然后双方根据交集的结果进行数据对齐、建模。
51.进一步的,步骤1,任务发起,由任务中心对参与方发起psi任务中的参与方包括:供方sender和需方receiver;
52.且供方sender:有n条数据,{(sid1),...,(sidn)};
53.需方receiver:有m条数据,{(rid1),...,(ridm)};
54.其中供方sender和需方receivr分别对应两个不同的金融公司。
55.进一步的,所述步骤1-步骤5中系统公开参数包括:
56.密码学hash函数:h
57.循环群g以及其素数阶q。
58.进一步的,所述步骤3,通过psi技术求得双方交集的算法过程如下;
59.a)sender本地选取随机数x∈z
q,
,然后计算h(sidi)
x
,i=1,...,n,并发送给
60.receiver;
61.b)receiver本地选取随机数y∈z
q,
,然后计算h(ridi)y,i=1,...,m,并发送给sender;
62.c)sender接收receiver发送过来的h(ridi)y,i=1,...,m;随后sender计算(h(ridi)y)
x
,i=1,...,m;并发送给receiver;
63.d)receiver接受sender发送过来的h(sidi)
x
,i=1,...,n;随后receiver计算(h(sidi)
x
)y,i=1,...,n;并发送给sender;
64.e)receiver和sender分别在本地计算:(h(sidi)
x
)y,i=1,...,n与(h(ridi)y)
x
,i=1,...,m两个集合的交集,并输出该交集对应的id值。
65.进一步的,所述步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存中的交集结果由receiver和sender分别输出id交集。
66.进一步的,所述步骤5返回执行任务结果,将保存结果反馈到任务中心,区分为三种情况:
67.供方保存结果,需方不保存结果;
68.需方保存结果,供方不保存结果;
69.两个参与方共同保存结果。
70.一种应用于金融场景的隐私集合求交系统,包括:调度平台、计算节点和数据节点;
71.调度平台,所述调度平台用于负责任务调度;
72.计算节点,所述计算节点设置在金融企业内部,用于执行交集计算;
73.数据节点,所述数据节点设置在金融企业内部,且与计算节点连接,数据节点用于存储各自计算数据。
74.进一步的,所述调度平台经双方协商后部署在任意位置,可布置在某一参与方内部或其他服务器上。
75.进一步的,所述计算节点中交集计算基于椭圆曲线的dh-basic-psi。
76.实施例一
77.请参阅图1-3,一种应用于金融场景的隐私集合求交方法,包括;
78.步骤1,任务发起,由任务中心对参与双方发起psi任务;
79.步骤2,建立通讯,参与方收到任务信息后,各自计算节点与对方建立通信;
80.步骤3,通过psi技术求得双方交集;
81.步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存;
82.步骤5,返回执行任务结果,将保存结果反馈到任务中心。
83.进一步的,在本方法中参与方只能知道和对方有交集部分的数据id,然后双方根据交集的结果进行数据对齐、建模。
84.进一步的,步骤1,任务发起,由任务中心对参与方发起psi任务中的参与方包括:供方sender和需方receiver;
85.且供方sender:有n条数据,{(sid1),...,(sidn)};
86.需方receiver:有m条数据,{(rid1),...,(ridm)};
87.其中供方sender和需方receivr分别对应两个不同的金融公司。
88.进一步的,所述步骤1-步骤5中系统公开参数包括:
89.密码学hash函数:h
90.循环群g以及其素数阶q。
91.进一步的,所述步骤3,通过psi技术求得双方交集的算法过程如下;
92.a)sender本地选取随机数x∈z
q,
,然后计算h(sidi)
x
,i=1,...,n,并发送给
93.receiver;
94.b)receiver本地选取随机数y∈z
q,
,然后计算h(ridi)y,i=1,...,m,并发送给sender;
95.c)sender接收receiver发送过来的h(ridi)y,i=1,...,m;随后sender计算(h(ridi)y)
x
,i=1,...,m;并发送给receiver;
96.d)receiver接受sender发送过来的h(sidi)
x
,i=1,...,n;随后receiver计算(h(sidi)
x
)y,i=1,...,n;并发送给sender;
97.e)receiver和sender分别在本地计算:(h(sidi)
x
)y,i=1,...,n与(h(ridi)y)
x
,i=1,...,m两个集合的交集,并输出该交集对应的id值。
98.进一步的,所述步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存中的交集结果由receiver和sender分别输出id交集。
99.进一步的,所述步骤5返回执行任务结果,将保存结果反馈到任务中心,区分为三种情况:
100.供方保存结果,需方不保存结果;
101.需方保存结果,供方不保存结果;
102.两个参与方共同保存结果。
103.综上所述,在金融建模的时候在进行金融联合建模前需要对各方数据进行数据对齐。通过本发明的隐私求交方法和系统能够在不获取双方数据集合的前提下求得双发数据的交集部分(id),再通过匹配内部的数据特征,来发起联合建模。目前,在基于联邦学习或多方安全计算技术的联邦建模方案中,隐私集合求交技术已经被认为是必不可少的前置步骤;算法安全性说明,在标准模型和ddh(decisional diffie-hellman)假设下,该协议可以满足半诚实敌手模型:即如果存在一个半诚实敌手,可以腐蚀控制其中一个计算节点,协议仍然能满足正确性(correctness)和隐私性(privacy)的安全要求——即不存在计算节点可以获悉任何其他的诚实计算节点(未被腐蚀)的输入数据。半诚实敌手需遵循协议规则。
104.实施例二
105.请参阅图1-图3,一种应用于金融场景的隐私集合求交方法,包括;
106.步骤1,任务发起,由任务中心对参与双方发起psi任务;
107.步骤2,建立通讯,参与方收到任务信息后,各自计算节点与对方建立通信;
108.步骤3,通过psi技术求得双方交集;
109.步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存;
110.步骤5,返回执行任务结果,将保存结果反馈到任务中心。
111.进一步的,在本方法中参与方只能知道和对方有交集部分的数据id,然后双方根据交集的结果进行数据对齐、建模。
112.进一步的,步骤1,任务发起,由任务中心对参与方发起psi任务中的参与方包括:
供方sender和需方receiver;
113.且供方sender:有n条数据,{(sid1),...,(sidn)};
114.需方receiver:有m条数据,{(rid1),...,(ridm)};
115.其中供方sender和需方receivr分别对应两个不同的金融公司。
116.进一步的,所述步骤1-步骤5中系统公开参数包括:
117.密码学hash函数:h
118.循环群g以及其素数阶q。
119.进一步的,所述步骤3,通过psi技术求得双方交集的算法过程如下;
120.a)sender本地选取随机数x∈z
q,
,然后计算h(sidi)
x
,i=1,...,n,并发送给receiver;
121.b)receiver本地选取随机数y∈z
q,
,然后计算h(ridi)y,i=1,...,m,并发送给sender;
122.c)sender接收receiver发送过来的h(ridi)y,i=1,...,m;随后sender计算(h(ridi)y)
x
,i=1,...,m;并发送给receiver;
123.d)receiver接受sender发送过来的h(sidi)
x
,i=1,...,n;随后receiver计算(h(sidi)
x
)y,i=1,...,n;并发送给sender;
124.e)receiver和sender分别在本地计算:(h(sidi)
x
)y,i=1,...,n与(h(ridi)y)
x
,i=1,...,m两个集合的交集,并输出该交集对应的id值。
125.进一步的,所述步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存中的交集结果由receiver和sender分别输出id交集。
126.进一步的,所述步骤5返回执行任务结果,将保存结果反馈到任务中心,区分为三种情况:
127.供方保存结果,需方不保存结果;
128.需方保存结果,供方不保存结果;
129.两个参与方共同保存结果。
130.综上所述,在进行金融统计时,在金融活动中通常会有跨机构的联合统计场景,如某保险公司c需要根据银行a,银行b来确定某一客户的资产等级。在这个过程中,如果涉及到id层级的统计分析,则需要通过隐私集合求交技术进行参与计算的数据的对齐,使得只有交集的部分参与跨机构之间的协同计算,非交集部分的用户对于其他参与方均无法获得,从而提升金融场景多方联合统计的安全性。
131.实施例三
132.请参阅图1-图3,一种应用于金融场景的隐私集合求交系统,包括:调度平台、计算节点和数据节点;
133.调度平台,所述调度平台用于负责任务调度;
134.计算节点,所述计算节点设置在金融企业内部,用于执行交集计算;
135.数据节点,所述数据节点设置在金融企业内部,且与计算节点连接,数据节点用于存储各自计算数据。
136.进一步的,所述调度平台经双方协商后部署在任意位置,可布置在某一参与方内部或其他服务器上。
137.进一步的,所述计算节点中交集计算基于椭圆曲线的dh-basic-psi。
138.本实施例通过基于隐私集合求交的隐私计算平台,能够在不获取其他参与方数据的前提下完成双方的数据(id)求交。相比现有技术体系和实现模式,通过隐私集合求交方式更加确保了数据安全和政策合规,在保证各参与方对各自数据的强拥有权前提下,深度植入到业务场景中,发挥它应该承担的历史使命。
139.本应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
140.以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
141.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
142.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
技术特征:1.一种应用于金融场景的隐私集合求交方法,其特征在于,包括;步骤1,任务发起,由任务中心对参与双方发起psi任务;步骤2,建立通讯,参与方收到任务信息后,各自计算节点与对方建立通信;步骤3,通过psi技术求得双方交集;步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存;步骤5,返回执行任务结果,将保存结果反馈到任务中心。2.如权利要求1所述的一种应用于金融场景的隐私集合求交方法,其特征在于,在本方法中参与方只能知道和对方有交集部分的数据id,然后双方根据交集的结果进行数据对齐、建模。3.如权利要求1所述的一种应用于金融场景的隐私集合求交方法,其特征在于,步骤1,任务发起,由任务中心对参与方发起psi任务中的参与方包括:供方sender和需方receiver;且供方sender:有n条数据,{(sid1),...,(sid
n
)};需方receiver:有m条数据,{(rid1),...,(rld
m
)};其中供方sender和需方receivr分别对应两个不同的金融公司。4.如权利要求3所述的一种应用于金融场景的隐私集合求交方法,其特征在于,所述步骤1-步骤5中系统公开参数包括:密码学hash函数:h循环群g以及其素数阶q。5.如权利要求4所述的一种应用于金融场景的隐私集合求交方法,其特征在于,所述步骤3,通过psi技术求得双方交集的算法过程如下;a)sender本地选取随机数x∈z
q
′
,然后计算h(sid
i
)
x
,i=1,...,n,并发送给receiver;b)receiver本地选取随机数y∈z
q
′
,然后计算h(rid
i
)
y
,i=1,...,m,并发送给sender;c)sender接收receiver发送过来的h(rid
i
)
y
,i=1,...,m;随后sender计算(h(rid
i
)
y
)
x
,i=1,...,m;并发送给receiver;d)receiver接受sender发送过来的h(sid
i
)
x
,i=1,...,n;随后receiver计算(h(sid
i
)
x
)
y
,i=1,...,n;并发送给sender;e)receiver和sender分别在本地计算:(h(sid
i
)
x
)
y
,i=1,...,n与(h(rid
i
)
y
)
x
,i=1,...,m两个集合的交集,并输出该交集对应的id值。6.如权利要求5所述的一种应用于金融场景的隐私集合求交方法,其特征在于,所述步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存中的交集结果由receiver和sender分别输出id交集。7.如权利要求6所述的一种应用于金融场景的隐私集合求交方法,其特征在于,所述步骤5返回执行任务结果,将保存结果反馈到任务中心,区分为三种情况:供方保存结果,需方不保存结果;需方保存结果,供方不保存结果;两个参与方共同保存结果。8.一种应用于金融场景的隐私集合求交系统,其特征在于,包括:调度平台、计算节点和数据节点;
调度平台,所述调度平台用于负责任务调度;计算节点,所述计算节点设置在金融企业内部,用于执行交集计算;数据节点,所述数据节点设置在金融企业内部,且与计算节点连接,数据节点用于存储各自计算数据。9.如权利要求8所述的一种应用于金融场景的隐私集合求交系统,其特征在于,所述调度平台经双方协商后部署在任意位置,可布置在某一参与方内部或其他服务器上。10.如权利要求8所述的一种应用于金融场景的隐私集合求交系统,其特征在于,所述计算节点中交集计算基于椭圆曲线的dh-basic-psi。
技术总结本发明适用于信息安全技术领域,提供了一种应用于金融场景的隐私集合求交方法及系统,包括;步骤1,任务发起,由任务中心对参与双方发起PSI任务;步骤2,建立通讯,参与方收到任务信息后,各自计算节点与对方建立通信;步骤3,通过PSI技术求得双方交集;步骤4,结果储存,输出交集结果,参与方选择将交集结果进行储存等步骤;通过基于隐私集合求交的隐私计算平台,能够在不获取其他参与方数据的前提下完成双方的数据(ID)求交;相比现有技术体系和实现模式,通过隐私集合求交方式更加确保了数据安全和政策合规,在保证各参与方对各自数据的强拥有权前提下,深度植入到业务场景中,发挥它应该承担的历史使命。该承担的历史使命。该承担的历史使命。
技术研发人员:徐德安 李升林 袁文俊 孔薇
受保护的技术使用者:上海阵方科技有限公司
技术研发日:2022.07.25
技术公布日:2022/11/1