本说明书一个或多个实施例涉及机器学习,尤其涉及一种用户生物特征向量的聚类方法及装置。
背景技术:
1、生物特征识别技术(biometric recognition technology)是利用人的生物特征,如指纹、虹膜、人脸、声音等,来进行身份验证和识别的一类技术,这类技术的优点主要有:1)高安全性:生物特征难以复制或伪造,提高了安全性;2)便利性:用户不需要记忆密码或携带额外的设备,使用方便;3)唯一性:每个人的生物特征都具有独特性。
2、由此,本说明书实施例提出一种改进方案,可以满足实际应用中对生物特征识别技术的更高要求,例如,有效提升识别准确率等。
技术实现思路
1、本说明书实施例描述一种用户生物特征向量的聚类方法及装置,可以有效提升生物特征识别的准确率。
2、根据第一方面,提供一种用户生物特征向量的聚类方法。该方法包括:采用近似最近邻搜索anns算法构建生物特征向量之间的anns图,其中部分节点对应的生物特征向量携带用户id;基于社区发现算法处理anns图,得到多个社区,其中各个社区包括若干节点标识;针对各个社区,基于其中具有用户id的节点对其他节点进行相似度计算和过滤处理,从而得到该用户id对应的聚类类簇。
3、在一个实施例中,所述anns算法为层次可导航小世界hnsw算法,所述anns图为hnsw图;所述hnsw图的构建包括:针对多个生物特征向量,按照其所对应多个原始生物特征的采集地区进行分组;从各个采集地区对应的组别中分别选取若干生物特征向量,作为所述hnsw算法的入口点,从而执行所述hnsw算法,得到所述hnsw图。
4、进一步,在一个具体的实施例中,其中还包括:在执行所述hnsw算法的过程中,将生物特征向量之间的相似度作为对应节点之间的连接边的权重。
5、在一个实施例中,所述社区发现算法为louvain算法;其中,基于社区发现算法处理anns图,得到多个社区,包括:基于所述部分节点对应的用户id,将所述anns图中对应相同用户id的多个节点合并为聚合节点,得到简化后的anns图;利用所述louvain算法处理所述简化后的anns图,得到多个第一社区;将所述多个第一社区中的聚合节点还原为原始的节点id,得到多个第二社区,作为所述多个社区。
6、进一步,在一个具体的实施例中,得到简化后的anns图,还包括:将所述多个节点之间的连接边重建为所述聚合节点的自环边,所述自环边的权重为所述多个节点之间连接边权重的和值。
7、在另一个具体的实施例中,得到简化后的anns图,还包括:将所述多个节点与其他节点之间的连接边重建为所述聚合节点与其他节点之间的连接边。
8、另一方面,在一个具体的实施例中,在得到所述目标用户id对应的聚类类簇之后,所述方法还包括:基于一批新增的生物特征向量,在所述anns图的基础上继续执行所述anns算法,得到新的anns图;根据所述多个第二社区,将所述新的anns图中属于同一社区的节点合并为聚合节点,得到简化后的新anns图;利用所述louvain算法处理所述简化后的新anns图,得到多个第三社区;将所述多个第三社区中的聚合节点还原为原始的节点id,得到多个第四社区,作为多个新社区;针对各个新社区,基于其中具有用户id的节点对其他节点进行相似度计算和过滤处理,从而得到所述该用户id对应的聚类类簇。
9、根据第二方面,提供一种用户生物特征向量的聚类装置。该装置包括:图构建模块,配置为采用近似最近邻搜索anns算法构建生物特征向量之间的anns图,其中部分节点对应的生物特征向量携带用户id;社区发现模块,配置为基于社区发现算法处理anns图,得到多个社区,其中各个社区包括若干节点标识;过滤模块,配置为针对各个社区,基于其中具有用户id的节点对其他节点进行相似度计算和过滤处理,从而得到该用户id对应的聚类类簇。
10、根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序在计算机中执行时,令计算机执行第一方面提供的方法。
11、根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,该处理器执行所述可执行代码时,实现第一方面提供的方法。
12、综上,采用本说明书实施例披露的上述方法及装置,开拓性地提出建立用户生物特征数据的拓扑图,并将社区发现算法应用于生物特征的聚类场景,可以在大幅降低计算量的同时,得到对相似生物特征数据区分度高、可用性强的聚类结果。
1.一种用户生物特征向量的聚类方法,包括:
2.根据权利要求1所述的方法,其中,所述anns算法为层次可导航小世界hnsw算法,所述anns图为hnsw图;所述hnsw图的构建包括:
3.根据权利要求2所述的方法,其中还包括:
4.根据权利要求1所述的方法,其中,所述社区发现算法为louvain算法;其中,基于社区发现算法处理anns图,得到多个社区,包括:
5.根据权利要求4所述的方法,其中,得到简化后的anns图,还包括:
6.根据权利要求4所述的方法,其中,得到简化后的anns图,还包括:
7.根据权利要求4所述的方法,其中,在得到所述目标用户id对应的聚类类簇之后,所述方法还包括:
8.一种用户生物特征向量的聚类装置,包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。
10.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。