一种基于房屋地址分段拆分相似度比对方法与流程

专利2025-08-09  112


本发明涉及房屋地址标准化领域,尤其涉及一种基于房屋地址分段拆分相似度比对方法。


背景技术:

1、在房管局、公积金等领域中,为了顺利办理房产业务,需要对历史房产数据与当前房产的数据进行房屋地址匹配,以判断是否为同一套房屋。随着业务量和房屋数据量的增加,人工匹配成本不断增加,因此需要通过自动化方式来进行匹配。若匹配成功,则进行后续业务流程,否则需进行额外操作或人工审核。

2、现有技术方案:

3、目前判断房屋地址是否相似,主要是输入房屋地址,借助模糊索引匹配算法判断历史房屋地址是否与当前房屋为同一套房屋;若未找到房屋地址一致的数据,借助编辑距离相似度算法匹配,找出相似度匹配最高的房屋地址;然后借助人工判定等方法实现地址是否一致。

4、模糊索引匹配算法,适用于房产地址文本完全一致,文本稍有差异即不一致。

5、编辑距离相似度算法,对房产地址长度敏感,且容易受地址标识词分词顺序、地址分割词影响。

6、人工判断,成本高,效率低,时效长。借助编辑距离相似度算法,该房屋数据相似度比较高,需借助人工判定,确定房屋地址数据一致,但实现成本高。


技术实现思路

1、鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于房屋地址分段拆分相似度比对方法。

2、根据本发明的一个方面,提供了一种基于房屋地址分段拆分相似度比对方法,所述比对方法包括:

3、采集房屋地址信息,并对所述房屋地址信息进行预处理,获得预处理房屋地址信息;

4、将所述预处理房屋地址信息采用分词解析算法进行处理,获得解析结果;

5、根据所述解析结果进行分段相似度计算,获得相似度;

6、根据所述相似度判断地址的一致性。

7、可选的,所述采集房屋地址信息,并对所述房屋地址信息进行预处理,获得预处理房屋地址信息具体包括:

8、采集房屋地址信息;

9、将特殊字符统一过滤、简体繁体数字、输入法全角半角、行政区域改名或合并、建筑物同一地标多个同义词表示。

10、可选的,所述将所述预处理房屋地址信息采用分词解析算法进行处理,获得解析结果具体包括:

11、按照房屋地址要素分割词拆分房屋地址,得到行政区域、道路级别、建筑物级别、明细级别每一级别对应的房屋地址要素分割词以及要素分割词对应的标识词。

12、可选的,所述行政区域包括:省、市和县;所述道路级别包括街道、号;所述建筑物级别包括:大厦、小区和花园;所述明细级别包括:座、栋、层和户。

13、可选的,所述根据所述解析结果进行分段相似度计算,获得相似度具体包括:

14、对于两房屋地址拆分后得到的地址分词片段,通过文本编辑距离等相似度算法,获得每一地址分词片段相似度。

15、可选的,所述根据所述相似度判断地址的一致性具体包括:

16、结合分段相似度计算、地址要素分割词权重、判断房屋地址是否一致。

17、可选的,所述特殊字符过滤包括:\r\n\t,,。·..;;::、!?@$%*^`~=+&'\"|/。

18、本发明提供的一种基于房屋地址分段拆分相似度比对方法,所述比对方法包括:采集房屋地址信息,并对所述房屋地址信息进行预处理,获得预处理房屋地址信息;将所述预处理房屋地址信息采用分词解析算法进行处理,获得解析结果;根据所述解析结果进行分段相似度计算,获得相似度;根据所述相似度判断地址的一致性。提高了一致性判断的精度。

19、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。



技术特征:

1.一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述比对方法包括:

2.根据权利要求1所述的一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述采集房屋地址信息,并对所述房屋地址信息进行预处理,获得预处理房屋地址信息具体包括:

3.根据权利要求1所述的一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述将所述预处理房屋地址信息采用分词解析算法进行处理,获得解析结果具体包括:

4.根据权利要求3所述的一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述行政区域包括:省、市和县;所述道路级别包括街道、号;所述建筑物级别包括:大厦、小区和花园;所述明细级别包括:座、栋、层和户。

5.根据权利要求1所述的一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述根据所述解析结果进行分段相似度计算,获得相似度具体包括:

6.根据权利要求1所述的一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述根据所述相似度判断地址的一致性具体包括:

7.根据权利要求2所述的一种基于房屋地址分段拆分相似度比对方法,其特征在于,所述特殊字符过滤包括:\r\n\t,,。·..;;::、!?@$%*^`~=+&'\"|/。


技术总结
本发明公开了一种基于房屋地址分段拆分相似度比对方法,所述比对方法包括:采集房屋地址信息,并对所述房屋地址信息进行预处理,获得预处理房屋地址信息;将所述预处理房屋地址信息采用分词解析算法进行处理,获得解析结果;根据所述解析结果进行分段相似度计算,获得相似度;根据所述相似度判断地址的一致性。提高了一致性判断的精度。

技术研发人员:杨新彦,樊义红,尹杰涛
受保护的技术使用者:北银金融科技有限责任公司
技术研发日:
技术公布日:2024/11/11
转载请注明原文地址: https://tieba.8miu.com/read-16727.html

最新回复(0)