用于文档图像识别的关键信息抽取方法及装置与流程

专利2023-08-18  100



1.本发明涉及人工智能领域,尤其涉及一种用于文档图像识别的关键信息抽取方法及装置。


背景技术:

2.文本或者文档图像识别后需要对识别到内容的关键信息进行抽取。关键信息抽取方法一类是基于规则的方法,即通过正则表达或者编辑距离寻找对应的关键信息。一类是基于机器学习或者深度学习的方法进行实体识别,输出与关键词对应的键值及位置信息。
3.基于规则的信息抽取方法,往往针对与关键词固定或者特征容易描述的情况下实施键值抽取,方法简单,但容易出错。基于bert或者transformer等深度学习模型的方法,对于每个键值都给出一个预测结果,但是没有从整个page或者文档层面进行综合度量,忽略了关键信息之间的相互联系以及互斥性。无法直接在模型层面解决同一实体类别的区分问题,如付款方和收款方,二者属于同一个实体,但需要区分抽取。


技术实现要素:

4.针对现有技术存在的问题,本发明提供一种用于文档图像识别的关键信息抽取方法及装置。
5.本发明提供一种用于文档图像识别的关键信息抽取方法,包括:基于ocr(optical character recognition,光学字符识别)识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。
6.根据本发明提供的一种用于文档图像识别的关键信息抽取方法,所述对每个键确定预设数量的候选键值,包括:对于每个键,根据键与键值的矩形框距离,在每个键四周找到矩形框距离最近的预设数量的候选键值;其中,所述矩形框距离的计算方式包括,对于键与键值的矩形框欧式距离最近的两点,根据所述两点横坐标和纵坐标差值的较小者确定。
7.根据本发明提供的一种用于文档图像识别的关键信息抽取方法,所述根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分,包括:根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分;根据所有键选取对应的候选键值时的评分,确定所有键选取候选键值的候选路径总评分;其中,所述几何特征分数为根据键与候选键值的位置关系确定的评分值;所述ocr识别分数为根据ocr识别的后验置信度确定的评分值;所述实体识别分数为根据实体识别模型输出的后验概率确定的评分值。
8.根据本发明提供的一种用于文档图像识别的关键信息抽取方法,所述根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分,包括:对于没有
共有候选键值的每个键,计算选取对应的候选键值时的评分;对于有共有候选键值的每个键,按照键的固定顺序优先级分别进行候选键值的选取,并在选择过程中不再选择已被其他键选取的候选键值;其中,对于有共有候选键值的键,若无候选键值可选,则候选键值评分为0。
9.根据本发明提供的一种用于文档图像识别的关键信息抽取方法,所述根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分之前,还包括:
10.根据如下公式确定几何特征分数;
[0011][0012]
其中,其中,d为选取的候选键值矩形框与键的矩形框之间的距离,d1、d2…di
为每个候选键值矩形框与键的矩形框之间的距离;h1、h2分别为键、选取的候选键值文字对应的矩形框高度。
[0013]
根据本发明提供的一种用于文档图像识别的关键信息抽取方法,所述根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分之前,还包括:
[0014]
根据如下公式确定ocr识别分数;
[0015][0016]
其中,r为选取的候选键值的ocr识别分数,m为选取的候选键值的字符数,fj为选取的候选键值第j个字符识别的后验置信度。
[0017]
本发明还提供一种用于文档图像识别的关键信息抽取装置,包括:初步提取模块,用于基于光学字符识别ocr识别结果,对每个键确定预设数量的候选键值;评分处理模块,用于根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;精确提取模块,用于在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。
[0018]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用于文档图像识别的关键信息抽取方法。
[0019]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用于文档图像识别的关键信息抽取方法。
[0020]
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述用于文档图像识别的关键信息抽取方法。
[0021]
本发明提供的用于文档图像识别的关键信息抽取方法及装置,通过候选路径可设置不同的键与候选键值的组合,并在候选路径总评分最高的情况下,确定每个键选取的目标键值,有效避免了类似基于规则的信息抽取方法中固定关键词带来的易出错问题。同时,该方法无需对每个键值都给出一个预测结果,而是综合考虑所有候选键值选取情况,有效利用了关键信息之间的相互联系以及互斥性,从而具有较高的准确率,可解决相似实体信
息抽取的全局优化问题。
附图说明
[0022]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]
图1是本发明提供的用于文档图像识别的关键信息抽取方法的流程示意图;
[0024]
图2是本发明提供的键与候选键值关系的示意图;
[0025]
图3是本发明提供的共有键值两种情况的示意图;
[0026]
图4是本发明提供的用于文档图像识别的关键信息抽取装置的结构示意图;
[0027]
图5是本发明提供的电子设备的结构示意图。
具体实施方式
[0028]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0029]
下面结合图1-图5描述本发明的用于文档图像识别的关键信息抽取方法及装置。图1是本发明提供的用于文档图像识别的关键信息抽取方法的流程示意图,如图1所示,本发明提供用于文档图像识别的关键信息抽取方法,包括:
[0030]
101、基于光学字符识别ocr识别结果,对每个键确定预设数量的候选键值。
[0031]
本发明为用于文档或者文本图像识别的关键信息抽取,如使用场景为基于ocr识别结果的关键信息抽取,ocr输出的信息包括文字行的位置矩形框,文字行识别的置信度等信息。本发明通过信息粗提取到精确提取分阶段的方案实现。
[0032]
其中,101步骤为信息粗提取的过程,信息粗提取的目的是为了后续步骤精确提取构建候选信息匹配网络。信息粗提取可以采用任意信息抽取方法,例如,基于正则表达式,对每个key(键)在其左侧、下侧及上侧按照顺序找到距离最近的预设数量可能的键值。例如,预设数量为3个,以下均以3个举例。
[0033]
102、根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分。
[0034]
其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。也就是说,每个键选取对应的候选键值时的评分可以为多个部分综合的评分,但至少包括键与候选键值的位置关系确定的评分值部分。其中,前述位置关系的含义包括键与键值文字行的高度、距离和位置关系等。
[0035]
经过信息粗提取后,key对应的候选键值组成一个小的子集。图2是本发明提供的键与候选键值关系的示意图,如图2所示。假设在一个信息抽取的任务中有n个关键信息需要抽取,每个key可以选择候选中的任意一个键值,所有key对应选择的键值就可以组成一条候选路径i,该候选路径对应的评价分数用s表示。当遍历所有的key所有可能的键值组
合,则总计有3n条路径,每一条路径实际都记录了每个key所对应的候选的索引,以便在求得最佳信息抽取组合后能回溯得到每个key对应的键值。
[0036]
所有键选取候选键值的候选路径总评分计算如下:
[0037][0038]
其中,snodej为第j个key对应的评价分数,n为键的总个数。
[0039]
103、在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果。
[0040]
本发明采用动态规划的方式,确定总分数最佳的候选路径:
[0041][0042]
其中,si为一条后候选抽取路径对应的评价分数,p
*
为最佳的信息抽取组合。
[0043]
得到候选路径总评分最高的候选路径后,将该候选路径下每个键的键值选取情况作为最终的信息提取结果,即形成确定的键值对,完成信息提取过程。
[0044]
本发明的用于文档图像识别的关键信息抽取方法,通过候选路径可设置不同的键与候选键值的组合,并在候选路径总评分最高的情况下,确定每个键选取的目标键值,有效避免了类似基于规则的信息抽取方法中固定关键词带来的易出错问题。同时,该方法无需对每个键值都给出一个预测结果,而是综合考虑所有候选键值选取情况,有效利用了关键信息之间的相互联系以及互斥性,从而具有较高的准确率,可解决相似实体信息抽取的全局优化问题。
[0045]
在一个实施例中,所述对每个键确定预设数量的候选键值,包括:对于每个键,根据键与键值的矩形框距离,在每个键四周找到矩形框距离最近的预设数量的候选键值;其中,所述矩形框距离的计算方式包括,对于键与键值的矩形框欧式距离最近的两点,根据所述两点横坐标和纵坐标差值的较小者确定。
[0046]
例如,基于正则表达式,根据矩形框的距离,对每个key在其左侧、下侧及上侧按照顺序找到距离最近的3个可能的键值。矩形框的距离定义为:假设key及键值对应矩形框欧式距离最近的点对分别为(x1,y1),(x2,y2),则两个矩形框的最近距离定义为:
[0047]
d=min(abs(x1-x2),abs(y1-y2))
[0048]
本发明实施例中,通过确定矩形框距离最近的预设数量的候选键值,提高粗提取的候选键值尽存在真正键值的概率,从而提高整个信息抽取准确度。
[0049]
在一个实施例中,所述根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分,包括:根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分;根据所有键选取对应的候选键值时的评分,确定所有键选取候选键值的候选路径总评分;其中,所述几何特征分数,为键与候选键值的位置关系确定的评分值;所述ocr识别分数,为根据ocr识别的后验置信度确定的评分值;所述实体识别分数,为根据实体识别模型输出的后验概率确定的评分值。
[0050]
具体而言,本发明针对每个key选取对应的候选键值的评分,即上述公式中的snode的计算主要包括几何特征分数、ocr识别分数以及语义分数的综合。例如,通过加权得到上述三方面的综合分:
[0051]
snode=λg+αr+βl
[0052]
其中,λ,α,β为权重参数用以平衡不同特征在评价中的作用。几何分数g,主要考虑key与键值文字行的高度、距离和位置关系。ocr识别分数r,可以为识别模型输出置信度。识别分数l,可以为基于bert、tansformer等深度实体识别模型输出的后验概率。
[0053]
本发明实施例中,融合几何信息、ocr识别信息以及语义层面的实体识别信息进行信息抽取,可有效提高最终抽取信息的准确度。
[0054]
在一个实施例中,所述根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分,包括:对于没有共有候选键值的每个键,计算选取对应的候选键值时的评分;对于有共有候选键值的每个键,按照键的固定顺序优先级分别进行候选键值的选取,并在选择过程中不再选择已被其他键选取的候选键值;其中,对于有共有候选键值的键,若无候选键值可选,则候选键值评分为0。
[0055]
图3是本发明提供的共有键值两种情况的示意图,如图3所示,本发明实施例根据key与key候选键值之间的关系,这些键值候选子集可以分为以下两种:a)n1个子集之间没有共有候选键值;b)n2个子集之间有共有候选键值。因此,信息抽取组合分数可以表示为:
[0056][0057]
对于情况a)候选子集之间没有交集,通过排列组合遍历每个key对应的候选即可。对于情况b)则按照key的固定顺序优先级进行确定键值候选。即当keyn1与keyn2(n1《n2)共有某个键值且生成抽取路径时keyn1已经选择该键值,那么keyn2只能选择其它键值。当keyn2没有键值可选择时,keyn2节点分数记为0。
[0058]
在一个实施例中,所述根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分之前,还包括:
[0059]
根据如下公式确定几何特征分数;
[0060][0061]
其中,d为选取的候选键值矩形框与键的矩形框之间的距离,d1、d2…di
为每个候选键值矩形框与键的矩形框之间的距离;h1、h2分别为键、选取的候选键值文字对应的矩形框高度。其中,d为d1、d2…di
中的一个。
[0062]
在一个实施例中,所述根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分之前,还包括:
[0063]
根据如下公式确定ocr识别分数;
[0064][0065]
其中,r为选取的候选键值的ocr识别分数,m为选取的候选键值的字符数,fj为选取的候选键值第j个字符识别的后验置信度。
[0066]
下面对本发明提供的用于文档图像识别的关键信息抽取装置进行描述,下文描述的用于文档图像识别的关键信息抽取装置与上文描述的用于文档图像识别的关键信息抽取方法可相互对应参照。
[0067]
图4是本发明提供的用于文档图像识别的关键信息抽取装置的结构示意图,如图4
所示,该用于文档图像识别的关键信息抽取装置包括:初步提取模块401、评分处理模块402和精确提取模块403。其中,初步提取模块401用于基于光学字符识别ocr识别结果,对每个键确定预设数量的候选键值;评分处理模块402用于根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;精确提取模块403用于在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。
[0068]
在一个实施例中,初步提取模块401具体用于:对于每个键,根据键与键值的矩形框距离,在每个键四周找到矩形框距离最近的预设数量的候选键值;其中,所述矩形框距离的计算方式包括,对于键与键值的矩形框欧式距离最近的两点,根据所述两点横坐标和纵坐标差值的较小者确定。
[0069]
在一个实施例中,评分处理模块402具体用于:根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分;根据所有键选取对应的候选键值时的评分,确定所有键选取候选键值的候选路径总评分;其中,所述几何特征分数为根据键与候选键值的位置关系确定的评分值;所述ocr识别分数为根据ocr识别的后验置信度确定的评分值;所述实体识别分数为根据实体识别模型输出的后验概率确定的评分值。
[0070]
在一个实施例中,评分处理模块402具体用于:对于没有共有候选键值的每个键,计算选取对应的候选键值时的评分;对于有共有候选键值的每个键,按照键的固定顺序优先级分别进行候选键值的选取,并在选择过程中不再选择已被其他键选取的候选键值;其中,对于有共有候选键值的键,若无候选键值可选,则候选键值评分为0。
[0071]
本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。
[0072]
本发明实施例所提供的用于文档图像识别的关键信息抽取装置,其实现原理及产生的技术效果和前述用于文档图像识别的关键信息抽取方法实施例相同,为简要描述,用于文档图像识别的关键信息抽取装置实施例部分未提及之处,可参考前述用于文档图像识别的关键信息抽取方法实施例中相应内容。
[0073]
图5是本发明提供的电子设备的结构示意图,如图5所示,该电子设备可以包括:处理器(processor)501、通信接口(communications interface)502、存储器(memory)503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。处理器501可以调用存储器503中的逻辑指令,以执行用于文档图像识别的关键信息抽取方法,该方法包括:基于ocr识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。
[0074]
此外,上述的存储器503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,
read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0075]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的用于文档图像识别的关键信息抽取方法,该方法包括:基于ocr识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。
[0076]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的用于文档图像识别的关键信息抽取方法,该方法包括:基于ocr识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。
[0077]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0078]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0079]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种用于文档图像识别的关键信息抽取方法,其特征在于,包括:基于光学字符识别ocr识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。2.根据权利要求1所述的用于文档图像识别的关键信息抽取方法,其特征在于,所述对每个键确定预设数量的候选键值,包括:对于每个键,根据键与键值的矩形框距离,在每个键四周找到矩形框距离最近的预设数量的候选键值;其中,所述矩形框距离的计算方式包括,对于键与键值的矩形框欧式距离最近的两点,根据所述两点横坐标和纵坐标差值的较小者确定。3.根据权利要求1所述的用于文档图像识别的关键信息抽取方法,其特征在于,所述根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分,包括:根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分;根据所有键选取对应的候选键值时的评分,确定所有键选取候选键值的候选路径总评分;其中,所述几何特征分数为根据键与候选键值的位置关系确定的评分值;所述ocr识别分数为根据ocr识别的后验置信度确定的评分值;所述实体识别分数为根据实体识别模型输出的后验概率确定的评分值。4.根据权利要求1所述的用于文档图像识别的关键信息抽取方法,其特征在于,所述根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分,包括:对于没有共有候选键值的每个键,计算选取对应的候选键值时的评分;对于有共有候选键值的每个键,按照键的固定顺序优先级分别进行候选键值的选取,并在选择过程中不再选择已被其他键选取的候选键值;其中,对于有共有候选键值的键,若无候选键值可选,则候选键值评分为0。5.根据权利要求3所述的用于文档图像识别的关键信息抽取方法,其特征在于,所述根据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分之前,还包括:根据如下公式确定几何特征分数;其中,d为选取的候选键值矩形框与键的矩形框之间的距离,d1、d2…
d
i
为每个候选键值矩形框与键的矩形框之间的距离;h1、h2分别为键、选取的候选键值文字对应的矩形框高度。6.根据权利要求3所述的用于文档图像识别的关键信息抽取方法,其特征在于,所述根
据几何特征分数、ocr识别分数以及实体识别分数,确定每个键选取对应的候选键值时的评分之前,还包括:根据如下公式确定ocr识别分数;其中,r为选取的候选键值的ocr识别分数,m为选取的候选键值的字符数,f
j
为选取的候选键值第j个字符识别的后验置信度。7.一种用于文档图像识别的关键信息抽取装置,其特征在于,包括:初步提取模块,用于基于光学字符识别ocr识别结果,对每个键确定预设数量的候选键值;评分处理模块,用于根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;精确提取模块,用于在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述用于文档图像识别的关键信息抽取方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用于文档图像识别的关键信息抽取方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用于文档图像识别的关键信息抽取方法。

技术总结
本发明提供一种用于文档图像识别的关键信息抽取方法及装置,该方法包括:基于OCR识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。该方法有效避免了类似基于规则的信息抽取方法中固定关键词带来的易出错问题。同时,该方法综合考虑所有候选键值选取情况,有效利用了关键信息之间的相互联系以及互斥性,从而具有较高的准确率,可解决相似实体信息抽取的全局优化问题。可解决相似实体信息抽取的全局优化问题。可解决相似实体信息抽取的全局优化问题。


技术研发人员:刘长松 王言伟 李捷 张玉琦 张瑞雪 张琛
受保护的技术使用者:上海浦东发展银行股份有限公司
技术研发日:2022.06.23
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-4655.html

最新回复(0)