本申请涉及数据处理,尤其涉及一种中文地址加密方法、装置、设备及存储介质。
背景技术:
1、中文地址加密通常是指将中文地址信息进行编码或者转换,以保护个人隐私或者安全需求。
2、目前,在中文地址加密的过程中,需要对中文地址进行标准化处理,以统一地址字段的格式和含义,修复错误的拼写和格式以及处理地址中的语义复杂性等。通过标准化处理,可以使地址数据达到一致的结构和规范,为后续的加密操作提供准确的基础。但由于中文地址具有地址格式多样性、地址语义复杂性等特点,给地址标准化操作带来了困难。在地址信息没有实现标准化的情况下,加密后的结果无法准确反映地址的实际位置,从而降低了加密的可靠性。
3、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本申请的主要目的在于提供一种中文地址加密方法、装置、设备及存储介质,旨在解决如何提高对中文地址进行加密的可靠性的技术问题。
2、为实现上述目的,本申请提出一种中文地址加密方法,所述的方法包括:
3、基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别;
4、基于预设的敏感级别确定所述地址实体类别中待加密的目标类别;
5、基于国密算法对所述目标类别对应的所述地址实体进行加密,得到加密地址。
6、在一实施例中,在基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别的步骤之前还包括:
7、获取地址数据,并将各个所述地址数据切分成单个字符;
8、基于bie规则对所述字符标注对应的地址实体标签,并根据标注之后的所述字符构建地址标注数据集;
9、基于所述地址标注数据集对预训练的bert模型进行训练,得到所述目标bert模型。
10、在一实施例中,所述基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别的步骤包括:
11、获取所述待加密地址,并对所述待加密地址进行分词处理,将所述待加密地址切分成单个字符;
12、将分词处理后的所述待加密地址输入所述目标bert模型进行地址识别,得到所述地址实体以及地址实体类别。
13、在一实施例中,所述将分词处理后的所述待加密地址输入所述目标bert模型进行地址识别,得到所述地址实体以及地址实体类别的步骤包括:
14、基于所述目标bert模型预测各个所述字符的地址实体标签,得到所述字符对应的地址实体标签的概率分布;
15、根据所述概率分布确定所述字符的目标地址实体标签;
16、基于bie规则组合有相同所述目标地址实体标签的所述字符,得到所述地址实体和所述地址实体类别。
17、在一实施例中,所述基于预设的敏感级别确定所述地址实体类别中待加密的目标类别的步骤包括:
18、获取所述待加密地址对应的敏感级别;
19、基于所述敏感级别获取对应的加密列表,所述加密列表中包括待加密的所述目标类别;
20、遍历各个所述地址实体,若所述地址实体对应的所述地址实体类别在所述加密列表中,则所述地址实体类别为目标类别。
21、在一实施例中,所述基于国密算法对所述目标类别对应的所述地址实体进行加密,得到加密地址的步骤包括:
22、基于sm4算法对所述目标类别对应的所述地址实体进行加密,用预设的特殊符号对所述待加密地址实体进行替换,得到加密地址。
23、在一实施例中,所述的方法还包括:
24、当获取到解密重组请求时,基于预设的权限控制策略验证所述解密请求对应的请求者是否具有解密重组权限;
25、若所述请求者具有解密重组权限,则基于所述解密重组请求对所述加密地址进行解密重组。
26、此外,为实现上述目的,本申请还提出一种中文地址加密装置,所述中文地址加密装置包括:
27、地址识别模块,用于基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别;
28、目标类别确定模块,用于基于预设的敏感级别确定所述地址实体类别中待加密的目标类别;
29、地址加密模块,用于基于国密算法对所述目标类别对应的所述地址实体进行加密,得到加密地址。
30、此外,为实现上述目的,本申请还提出一种中文地址加密设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的中文地址加密方法的步骤。
31、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的中文地址加密方法的步骤。
32、本申请提供了一种中文地址加密方法,包括以下步骤:基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别,预设的bert模型通过其上下文理解和泛化能力,能够识别出地址中的关键信息,而不需要依赖于固定的地址格式,因此,通过bert模型对待加密地址进行识别解析可以直接得到地址中的各个组成部分及其类别,无需对待加密的中文地址进行标准化操作,避免了由于对中文地址进行标准化操作困难导致的行加密的可靠性降低的问题,简化了地址加密的过程;基于预设的敏感级别确定所述地址实体类别中待加密的目标类别,通过选择不同的敏感级别对待加密地址进行加密,而不是通过固定的加密规则进行加密,实现了灵敏适配不同的加密需求,以及隐私保护和业务需求之间的平衡,在最大程度上保障隐私信息不暴露;基于国密算法对所述目标类别对应的所述地址实体进行加密,得到加密地址,采用国密算法对地址进行加密,确保了地址加密的方法符合适用的法律法规和隐私保护标准,符合数据安全管理要求。
33、综上可知,本申请采用bert模型对中文地址进行智能解析避免了对待加密地址进行标准化操作,根据需求选择不同的敏感级别对中文地址进行加密,通过智能地址解析和智能规则匹配的方式实现了对中文地址进行动态加密,灵活适配加密场景中各个业务的不同加密级别和需求,实现了准确、高效的动态地址加密,在最大程度保留数据可识别性的同时,保障隐私信息不泄露。
1.一种中文地址加密方法,其特征在于,所述的方法包括:
2.如权利要求1所述的方法,其特征在于,在基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别的步骤之前还包括:
3.如权利要求1所述的方法,其特征在于,所述基于预设的目标bert模型对待加密地址进行地址识别,得到所述待加密地址对应的地址实体以及所述地址实体的地址实体类别的步骤包括:
4.如权利要求3所述的方法,其特征在于,所述将分词处理后的所述待加密地址输入所述目标bert模型进行地址识别,得到所述地址实体以及地址实体类别的步骤包括:
5.如权利要求1所述的方法,其特征在于,所述基于预设的敏感级别确定所述地址实体类别中待加密的目标类别的步骤包括:
6.如权利要求1所述的方法,其特征在于,所述基于国密算法对所述目标类别对应的所述地址实体进行加密,得到加密地址的步骤包括:
7.如权利要求1至6中任一项所述的方法,其特征在于,所述的方法还包括:
8.一种中文地址加密装置,其特征在于,所述装置包括:
9.一种中文地址加密设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至7中任一项所述的中文地址加密方法的步骤。
10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的中文地址加密方法的步骤。