本发明涉及金融信息校验领域,尤其涉及一种智能印章识别方法以及印章识别系统。
背景技术:
1、在金融机构服务于企业交易的过程中,信息的真实性与安全性至关重要,而印章作为确认法律效力和交易可信度的关键,其识别校验的准确性与效率,直接影响着金融业务处理的速度与风控能力。现有的印章识别技术,主要依赖于传统ocr方法并辅以tps算法,来处理弯曲或扭曲的文本,这种方式在实际业务中仍然存在诸多不足之处。
2、具体而言,现有印章识别技术存在训练成本高昂、模型精度受限、处理流程复杂,三个主要技术缺陷。在训练成本方面,tps算法的引入增加了模型的复杂性,使得训练所需的数据量巨大,且对数据标注的精确度要求极高,导致整个过程成本高昂;在模型精度方面,由于传统架构的局限性,即便投入大量资源,现有模型在识别复杂场景下的印章文字时精度仍然不理想;在处理流程方面,现有的处理流程普遍分多个独立步骤,这种模块化处理方式容易导致信息损失或错误,影响最终的识别校验效果。然而针对上述技术问题,目前行业内尚未提出合理的智能印章识别方案。
技术实现思路
1、本发明所要解决的技术问题是:如何设计出一种智能印章识别方案,能够解决印章识别过程中训练成本高昂、模型精度受限、处理流程复杂的问题,即减少训练成本,提高识别精度,并简化处理流程。
2、为解决上述问题,本发明实施例提出一种智能印章识别方法以及印章识别系统,能够解决印章识别过程中训练成本高昂、模型精度受限、处理流程复杂的问题,即减少训练成本,提高识别精度,并简化处理流程。
3、在减少训练成本方面,鉴于传统印章识别技术依赖大量人工标注的样本进行模型训练,这不仅耗时费力,而且成本高昂;本发明通过引入先进的预训练模型技术和端到端学习框架,能够有效利用未标注或弱标注数据进行自我优化训练,显著降低了对昂贵的手工标注数据的依赖,从而在保证识别性能的同时,大幅度降低了系统的训练成本。
4、在提高识别精度方面,企业的印章普遍包含复杂的图案信息,以及细微的文字信息,传统方法在识别这类复杂结构时容易出错;本发明通过整合图像理解和文本生成,特别是采用高性能的transformer架构,能够深度挖掘印章图像特征与文字语义之间的关联,即使面对印章变形、模糊或是部分遮挡的情况,也能实现印章文字的高精度识别,极大增强了金融交易的安全性和合规性。
5、在简化处理流程方面,现有的印章识别流程,从印章区域的检测,到文字信息的提取,普遍需要多个独立的步骤和算法,这不仅增加了系统复杂度,还可能引入额外的错误;本发明将印章检测、定位、文字识别等关键步骤,融合在一个连续的处理流程中,减少了中间环节的转换损耗,提升了整个系统的处理速度,进而确保在各种复杂环境下都能稳定识别,满足金融行业对高效、准确信息校验的迫切需求。
6、第一方面,本发明实施例提出一种智能印章识别方法,所述智能印章识别方法用于识别原始文档图像当中的印章之后提取出识别结果,所述方法包括:s1,对原始文档图像进行图像预处理,获得待分析图像;s2,以所述待分析图像为背景进行印章区域检测,定位出目标印章区域;s3,将所述目标印章区域的图像内容转化为印章图像;s4,对所述印章图像进行基于多模态的印章识别,提取出识别结果;s5,将识别结果与已知信息之间进行校对匹配,完成对识别结果的验证。
7、其进一步的技术方案为,所述s1,对原始文档图像进行图像预处理,获得待分析图像,包括:对原始文档图像进行去噪处理以及画质提升处理,获得待分析图像,以提高后续处理的准确性。
8、其进一步的技术方案为,所述s2,以所述待分析图像为背景进行印章区域检测,定位出目标印章区域,包括:通过预训练的图像tfm模型,直接对待分析图像进行分析,通过自注意力机制,定位出目标印章区域。
9、其进一步的技术方案为,所述s3,将所述目标印章区域的图像内容转化为印章图像,包括:参照所述目标印章区域,对所述待分析图像进行图像剪裁,精确裁剪出印章图像,为后续的文本识别的步骤做准备。
10、其进一步的技术方案为,所述图像tfm模型即图像transformer模型,所述文本tfm模型即文本transformer模型;所述s4,对所述印章图像进行基于多模态的印章识别,提取出识别结果,包括:
11、s401,对所述印章图像进行图像tfm特征提取,获得图像特征序列z。
12、s402,将图像特征序列z作为条件,通过一个映射函数,映射到文本特征空间,获得多个特征,通过文本tfm模型利用多个特征进行wordpiece级别的序列生成,获得文本特征序列y1。
13、s403,直接在tfm架构中融入位置编码p,使文本tfm模型能够学习到文本的空间布局信息,获得文本特征序列y2。
14、s404,使用交叉熵损失函数来衡量预测文本特征序列y1与真实标签之间的差异,以及文本特征序列y2与真实标签之间的差异。
15、s405,基于提取的印章文字、已知的公司名称信息,通过计算编辑距离的方式,判断二者是否一致,进而提取出识别结果。
16、上述方案中,所述交叉熵损失函数,可以用交叉熵损失函数lce表示。
17、上述方案中,所述真实标签,可以用真实标签ytrue表示。
18、进一步地,所述s401步骤的图像特征序列z,其计算公式为:
19、z=transformerimage(z1,z2,...,zn)
20、其中,z表示经过tfm处理后的图像特征序列,所述图像特征序列z包含多个图像内容信息。
21、在一实施例中,所述方法用于处理原始印章图像,所述原始印章图像经过预处理后,被分割为n个非重叠的图像块{p1,p2,...,pn},每个图像块通过嵌入函数e:pi→zi转换为向量表示zi,其中zi的公式为:
22、zi∈rd
23、其中d是向量的维度,这些向量通过自注意力机制被聚合以捕捉全局上下文信息,具体的公式化表示参见图像特征序列z的计算公式。
24、进一步地,所述s402步骤的文本特征序列y1,其计算公式为:
25、y1=transformertext(g(z))
26、其中,所述文本特征序列y1表示最终生成的wordpiece序列,也就是wp序列,每个wordpiece对应于一个特定的子词或字符。
27、在一实施例中,将得到的图像特征序列z作为条件,通过一个映射函数,映射到文本特征空间,所述映射函数为:
28、g:rn×d→rm×e
29、即实数域内的n*d维向量映射到实数域内的m*e维向量,其中的m是潜在文本特征序列的长度,e是文本特征维度。接下来,通过文本tfm模型利用多个特征进行wordpiece级别的序列生成,具体的模型表述参见文本特征序列y1的计算公式。
30、进一步地,所述s403步骤的文本特征序列y2,其计算公式为:
31、y2=transformertext(g(z)+p)
32、其中,所述位置编码p是动态的二维位置编码,位置编码p随输入序列的特性而变化,帮助模型理解字符间的关系,即使在弯曲或不规则排列的情况下也能有效识别。所述y1与y2的区别在于,y1表示不含位置编码的wordpiece序列,也就是不含位置编码的wp序列码。
33、在一实施例中,为了处理弯曲的印章文本,或不规则印章文本,本技术不采用传统的tps变换,而是直接在tfm架构中融入位置编码p,使模型能够学习到文本的空间布局信息。因此,加入位置编码p后,具体的调整后的公式参见文本特征序列y2的计算公式。
34、进一步地,所述s404步骤的交叉熵损失函数lce,其计算公式为:
35、
36、其中,m表示序列长度,即样本数据的数量,yi表示预测序列y中第i个元素的概率值,即模型对第i个样本属于某个类别的预测概率。
37、在一实施例中,模型训练的过程期间,使用交叉熵损失函数lce来衡量预测文本特征序列y1与真实标签ytrue之间的差异,以及文本特征序列y2与真实标签ytrue之间的差异,具体的公式参见交叉熵损失函数lce的计算公式。
38、第二方面,本发明实施例还提出一种印章识别系统,所述印章识别系统可以实现印章信息的高效识别,以及实现印章信息的高效识别精确提取,所述印章识别系统用于执行如第一方面所述的方法。
39、综上所述,本技术涉及基于多模态的印章识别方法,通过端到端的tfm模型体系,不仅提高了识别精度和效率,同时也简化了模型结构,降低了对人工标注数据的依赖,实现了对复杂印章文本的有效识别。
40、本技术方案在金融信息校验领域的应用,实现了以下技术效果:
41、第一,提高识别效率和精度:采用预训练的tfm模型,减轻对大规模手动标注数据的依赖,提高模型训练效率,增强对复杂印章图案及细微文字特征的捕捉能力,提高识别准确率,减少人工复核需求,提升自动化处理可靠性。
42、第二,降低运营成本:通过设计精简的端到端处理流程,整合印章检测、文字识别等步骤,简化系统架构,降低硬件资源需求和软件开发、维护成本,加速产品迭代周期,节省长期运营开支。
43、第三,增强系统灵活性:采用多模态融合策略,使模型具备对多样化印章类型和文字样式的强大适应能力,提高系统灵活性,应对金融市场上不断变化的信息校验需求。
44、第四,提升用户体验:通过快速且准确的印章识别能力,加速关键文档审核流程,缩短客户等待时间,提高业务处理效率。
1.一种智能印章识别方法,其特征在于,所述智能印章识别方法用于识别原始文档图像当中的印章之后提取出识别结果,所述方法包括:
2.根据权利要求1所述的智能印章识别方法,其特征在于,所述s1,对原始文档图像进行图像预处理,获得待分析图像,包括:
3.根据权利要求2所述的智能印章识别方法,其特征在于,所述s2,以所述待分析图像为背景进行印章区域检测,定位出目标印章区域,包括:
4.根据权利要求3所述的智能印章识别方法,其特征在于,所述s3,将所述目标印章区域的图像内容转化为印章图像,包括:
5.根据权利要求4所述的智能印章识别方法,其特征在于,所述s4,对所述印章图像进行基于多模态的印章识别,提取出识别结果,包括:
6.根据权利要求5所述的智能印章识别方法,其特征在于,所述s401步骤的图像特征序列z,其计算公式为:
7.根据权利要求5所述的智能印章识别方法,其特征在于,所述s402步骤的文本特征序列y1,其计算公式为:
8.根据权利要求5所述的智能印章识别方法,其特征在于,所述s403步骤的文本特征序列y2,其计算公式为:
9.根据权利要求5所述的智能印章识别方法,其特征在于,所述s404步骤的交叉熵损失函数lce,其计算公式为:
10.一种印章识别系统,其特征在于,所述印章识别系统用于执行如权利要求1至9任意一项所述的方法。
