1.本发明涉及图像识别技术领域,特别涉及一种无模板识别图纸材料表的装置。
背景技术:2.目前,图纸以纸质或pdf为主,这些非结构化的图纸导致无法直接获取图纸上的材料表信息进行利用,需要花大量人力成本将其重新摘录到电子表格中。通过计算机自动提取材料表将大大提供工作效率。
3.材料表表格类型按有无表格线划分可分为无线表格和有线表格。现有通用表格识别技术可以比较好的识别有线表格,但对于无线表格识别比较差。
4.图纸内通常存在多种表格,不同表格其内容意义不同,现有技术都是通过定义模板,指定表格在图纸内的位置以及指定列如何划分来区分不同的表格、不同的列。该技术需要事先定义好模板,降低了系统使用实时性,提高了系统使用复杂度。并且无法适应表格在图纸内位置不固定这一情况。
技术实现要素:5.本发明提供,用以解决无线表格的识别精度不高且需要事先定义好模板的情况,且同时适用于有线表格的识别。
6.一种无模板识别图纸材料表的装置,包括:
7.获取图纸,确定图纸内材料表区域信息;
8.根据材料表区域信息,生成表格图片;
9.根据所述表格图片,生成横竖像素均值曲线;
10.针对所述横竖像素均值曲线进行遍历,获取表格线位置信息;
11.根据所述表格线位置信息,获取表格线内文字信息;
12.针对所述表格线内文字信息进行划分,获取表头文字,并根据所述表头文字确定对应的表头行;
13.基于所述表头行,对材料表中的文字进行处理,确定表格线;
14.基于预设的表头字段对表头文字进行匹配,确定匹配结果,并根据所述匹配结果确定表头字段的含义;
15.获取材料表中的序号列,并根据表头字段的含义,对序列行进行合并,确定合并结果。
16.作为本发明的一种实施例:所述获取图纸,确定图纸内材料表区域信息,包括:
17.将图纸上传至预先训练的表格对象检测神经网络模型,确定所述材料表的左上角点和右下角点。
18.作为本发明的一种实施例:所述预先训练的表格对象检测神经网络模型用于针对图纸内材料表进行区域定位。
19.作为本发明的一种实施例:所述根据所述表格图片,生成横竖像素均值曲线,包
括:
20.获取表格图片中每一行像素值,针对每一行像素计算像素平均值,获取表格图片对应的横向像素均值曲线;
21.获取表格图片中每一列像素值,针对每一列像素计算像素平均值,获取表格图片对应的竖向像素均值曲线。
22.作为本发明的一种实施例:所述针对所述横竖像素均值曲线进行遍历,获取表格线位置信息,包括:
23.针对所述表格图片对应的横竖像素均值曲线对应的像素均值进行判断,确定判断结果。
24.作为本发明的一种实施例:所述针对所述表格图片对应的横竖像素均值曲线对应的像素均值进行判断,确定判断结果,包括:
25.当像素均值小于10,判断结果为所述表格图片中存在实线表格线;
26.当像素均值大于250,判断结果为所述表格图片中存在隐形表格线。
27.作为本发明的一种实施例:所述针对所述表格线内文字信息进行划分,获取表头文字,包括:
28.基于预设的表头字段对材料表中的每一行文字进行匹配,并确定匹配率;
29.当所述匹配率大于90%时,确定所述文字为表头文字。
30.作为本发明的一种实施例:所述基于所述表头行,对材料表中的文字进行处理,确定表格线,包括:
31.获取表头位置,对表头位置以上的表格线和文字进行删除;
32.获取材料表内覆盖于文字之上的表格线,对覆盖于文字之上的表格线进行删除;
33.获取材料表内剩余表格线信息,并将所述剩余表格线信息确定为表格线。
34.作为本发明的一种实施例:所述获取材料表中的序号列,并根据表头字段的含义,对序列行进行合并,确定合并结果,包括:
35.针对所述材料表中的序号列进行检查,确定序号列中是否存在空序号;
36.若序号列中存在空序号,获取空序号所在的行和所述空序号所在的行的上一行,并将所述空序号所在的行和空序号所在的行的上一行进行合并,确定行合并结果。
37.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
38.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
39.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
40.图1为本发明实施例中一种无模板识别图纸材料表的装置的流程示意图;
41.图2为本发明实施例中一种无模板识别图纸材料表的装置中分别针对材料表每一行或列像素平均值连接而成的横竖向像素均值曲线的效果显示图;
42.图3为本发明实施例中一种无模板识别图纸材料表的装置中根据材料表中的横竖
向像素均值曲线生成表格线的结果显示图;
43.图4为本发明实施例中一种无模板识别图纸材料表的装置中针对表头文字的判断流程图;
44.图5为本发明实施例中一种无模板识别图纸材料表的装置中获取确定表格线的结果图。
具体实施方式
45.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
46.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,“多个”的含义是两个或两个以上,除非另有明确具体的限定。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
47.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
48.实施例1:
49.本发明实施例提供了一种无模板识别图纸材料表的装置,如图1所示,包括:
50.获取图纸,确定图纸内材料表区域信息;
51.根据材料表区域信息,生成表格图片;
52.根据所述表格图片,生成横竖像素均值曲线;
53.针对所述横竖像素均值曲线进行遍历,获取表格线位置信息;
54.根据所述表格线位置信息,获取表格线内文字信息;
55.针对所述表格线内文字信息进行划分,获取表头文字,并根据所述表头文字确定对应的表头行;
56.基于所述表头行,对材料表中的文字进行处理,确定表格线;
57.基于预设的表头字段对表头文字进行匹配,确定匹配结果,并根据所述匹配结果确定表头字段的含义;
58.获取材料表中的序号列,并根据表头字段的含义,对序列行进行合并,确定合并结果;
59.本技术方案实施的原理:本技术方案中通过对纸质材料表定位模型进行训练,利用深度学习的对象检测网络进行训练,如ppyolov2对象检测网络,并将训练好的网络模型转成推理用的模型,及材料表定位模型,确定材料表的区域信息,即左上角和右下角定位信息,根据对材料表的定位信息进行截取,生成表格图片;对表格图片的每一行像素计算像素平均值,分别获得表格图片的横、竖像素均值曲线;对横、竖像素均值曲线进行遍历,获取实线表格线和隐形表格线,再将表格图片送入光学字符识别系统进行文字识别,得到选择区域的文字位置和信息;再通过行表格线对文字进行划分,判断每一行文字是否是表头文字,
如果存在表头文字,则认为是表头行;删除表头行以上的表格线和文字,删除覆盖于文字之上的表格线,剩下的表格线为确定的表格线;利用已收集的表头字段对表头文字进行匹配,匹配上则根据收集表头字段的含义确定当前表头字段的含义,根据表头含义,将序号列中存在空序号的行与上一行进行合并。
60.上述技术方案的有益效果为:本发明中通过深度学习的对象检测网络进行训练,有利于提高材料表识别的准确性和效率,且材料表定位模型只需要训练一次,后续可以多次使用,提高了模型的利用率;通过对表格图片的横竖像素均值曲线进行计算,有利于快速获取图纸材料表内的横竖表格线与背景及文字之间的差异,提高找出表格线的准确率;通过光学字符识别系统对材料表内的文字进行识别,获得的目标文字的区域位置和信息可信度较高且识别的速度较快;因此,本发明可以不用定制模板自动识别图纸内材料表内容,并支持无表格线,表格识别的效率和准确率较高。
61.实施例2:
62.本发明实施例提供了一种无模板识别图纸材料表的装置,包括:所述获取图纸,确定图纸内材料表区域信息,包括:
63.将图纸上传至预先训练的表格对象检测神经网络模型,确定所述材料表的左上角点和右下角点;
64.本技术方案实施的原理:本技术方案中的表格对象检测神经网络模型用于自动确定图纸内材料表所在的区域,模型在收集图纸时,将图纸保持宽高比转成高度为2000像素的图片,通过人工在图纸图片上标记材料表区域,利用度学习的对象检测网络进行训练。例如ppyolov2对象检测网络,将训练好的网络模型转成推理用的模型,及材料表定位模型,最后将图纸送入材料表模型中即可获得材料表对应的位置;
65.上述技术方案的有益效果为:本发明中的表格对象检测神经网络模型只需训练一次,后续可多次使用,有利于提高网络使用效率,节省材料表的识别时间,此外,通过深度学习对网络进行训练,有利于提高网络的适应性,处理数据的速度较快且准确率较高,能够提高对无表格图片的识别和定位。
66.实施例3:
67.本发明实施例提供了一种无模板识别图纸材料表的装置,如图2所示,包括:所述根据所述表格图片,生成横竖像素均值曲线,包括:
68.获取表格图片中每一行像素值,针对每一行像素计算像素平均值,获取表格图片对应的横向像素均值曲线;
69.获取表格图片中每一列像素值,针对每一列像素计算像素平均值,获取表格图片对应的竖向像素均值曲线;
70.本技术方案实施的原理:本技术方案中通过对表格图片按照像素分别对每一行、每一列计算像素平均值,图2中,右侧曲线表示横向像素均值曲线,底部表示竖向像素均值曲线;
71.上述技术方案的有益效果为:本发明中的装置通过对材料表的横向和竖向像素均值曲线进行计算,有利于获取材料表横竖表格线与背景及文字之间的差异,从而更好的对无线表格和有线表格进行识别,实用性较强,且能够很好的应对表格在图纸内位置不固定的情况。
72.实施例4:
73.本发明实施例提供了一种无模板识别图纸材料表的装置,包括:所述针对所述表格图片对应的横竖像素均值曲线对应的像素均值进行判断,确定判断结果,包括:
74.当像素均值小于10,判断结果为所述表格图片中存在实线表格线;
75.当像素均值大于250,判断结果为所述表格图片中存在隐形表格线;
76.本技术方案实施的原理:本技术方案中遍历横竖像素均值曲线,如果均值小于10,则人为存在实线表格线。如果均值大于250,则认为存在隐形表格线,图3的表格内所画线表示可能的表格线;
77.上述技术方案的有益效果为:本发明中通过对横竖像素均值曲线对应的均值进行判断,确定可能的表格线,有利于后续基于可能的表格线进行判断,从而有利于提高表格线的准确率,增加对材料表的识别效率。
78.实施例5:
79.本发明实施例提供了一种无模板识别图纸材料表的装置,如图4所示,包括:所述针对所述表格线内文字信息进行划分,获取表头文字,包括:
80.基于预设的表头字段对材料表中的每一行文字进行匹配,并确定匹配率;
81.当所述匹配率大于90%时,确定所述文字为表头文字;
82.本技术方案实施的原理:本技术方案中用行表格线对文字进行行划分,依次对每一行文字进行判断是否是表头文字,如果存在表头文字,则认为该行为表头行,表头文字的判断利用已收集的所有表头字段进行匹配,匹配率大于90%则认为是表头文字,具体判断流程见图4;
83.上述技术方案的有益效果为:本发明中针对可能的表格线作为目标处理对象,通过针对已有的表头字段进行匹配,确定表头文字,这种方式确定的表头文字的准确性较高,从而有利于提高表格线的准确率,增加对材料表的识别效率。
84.实施例6:
85.本发明实施例提供了一种无模板识别图纸材料表的装置,如图5所示,包括:所述基于所述表头行,对材料表中的文字进行处理,确定表格线,包括:
86.获取表头位置,对表头位置以上的表格线和文字进行删除;
87.获取材料表内覆盖于文字之上的表格线,对覆盖于文字之上的表格线进行删除;
88.获取材料表内剩余表格线信息,并将所述剩余表格线信息确定为表格线;
89.本技术方案实施的原理:本技术方案中通过删除表头以上的表格线及文字,删除覆盖于文字之上的表格线,剩下的表格线为确定的表格线;
90.上述技术方案的有益效果为:本发明中将可能的表格线作为目标处理对象,通过删除可能的表格线中的无效部分,剩余的表格线即为确定的表格线,通过这种方式获取的确定的表格线准确性较高,能够支持不用定制模板自动识别图纸内材料表内容,并支持无表格线表格的识别。
91.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形
式。
92.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
93.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
94.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
95.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
技术特征:1.一种无模板识别图纸材料表的装置,其特征在于,包括:获取图纸,确定图纸内材料表区域信息;根据材料表区域信息,生成表格图片;根据所述表格图片,生成横竖像素均值曲线;针对所述横竖像素均值曲线进行遍历,获取表格线位置信息;根据所述表格线位置信息,获取表格线内文字信息;针对所述表格线内文字信息进行划分,获取表头文字,并根据所述表头文字确定对应的表头行;基于所述表头行,对材料表中的文字进行处理,确定表格线;基于预设的表头字段对表头文字进行匹配,确定匹配结果,并根据所述匹配结果确定表头字段的含义;获取材料表中的序号列,并根据表头字段的含义,对序列行进行合并,确定合并结果。2.如权利要求1所述的装置,其特征在于,所述获取图纸,确定图纸内材料表区域信息,包括:将图纸上传至预先训练的表格对象检测神经网络模型,确定所述材料表的左上角点和右下角点。3.如权利要求2所述的装置,其特征在于,所述预先训练的表格对象检测神经网络模型用于针对图纸内材料表进行区域定位。4.如权利要求1所述的装置,其特征在于,所述根据所述表格图片,生成横竖像素均值曲线,包括:获取表格图片中每一行像素值,针对每一行像素计算像素平均值,获取表格图片对应的横向像素均值曲线;获取表格图片中每一列像素值,针对每一列像素计算像素平均值,获取表格图片对应的竖向像素均值曲线。5.如权利要求1所述的装置,其特征在于,所述针对所述横竖像素均值曲线进行遍历,获取表格线位置信息,包括:针对所述表格图片对应的横竖像素均值曲线对应的像素均值进行判断,确定判断结果。6.如权利要求5所述的装置,其特征在于,所述针对所述表格图片对应的横竖像素均值曲线对应的像素均值进行判断,确定判断结果,包括:当像素均值小于10,判断结果为所述表格图片中存在实线表格线;当像素均值大于250,判断结果为所述表格图片中存在隐形表格线。7.如权利要求1所述的装置,其特征在于,所述针对所述表格线内文字信息进行划分,获取表头文字,包括:基于预设的表头字段对材料表中的每一行文字进行匹配,并确定匹配率;当所述匹配率大于90%时,确定所述文字为表头文字。8.如权利要求1所述的装置,其特征在于,所述基于所述表头行,对材料表中的文字进行处理,确定表格线,包括:获取表头位置,对表头位置以上的表格线和文字进行删除;
获取材料表内覆盖于文字之上的表格线,对覆盖于文字之上的表格线进行删除;获取材料表内剩余表格线信息,并将所述剩余表格线信息确定为表格线。9.如权利要求1所述的装置,其特征在于,所述获取材料表中的序号列,并根据表头字段的含义,对序列行进行合并,确定合并结果,包括:针对所述材料表中的序号列进行检查,确定序号列中是否存在空序号;若序号列中存在空序号,获取空序号所在的行和所述空序号所在的行的上一行,并将所述空序号所在的行和空序号所在的行的上一行进行合并,确定行合并结果。
技术总结本发明提供了一种无模板识别图纸材料表的装置,包括:获取图纸,确定图纸内材料表区域信息,并生成表格图片;根据所述表格图片,生成横竖像素均值曲线;对横竖像素均值曲线进行遍历,获取表格线位置信息;根据表格线位置信息,获取表格线内文字信息;针对表格线内文字信息进行划分,确定对应的表头行;基于所述表头行,对材料表中的文字进行处理,确定表格线;基于预设的表头字段对表头文字进行匹配,并根据匹配结果确定表头字段的含义;获取材料表中的序号列,并根据表头字段的含义,对序列行进行合并。本发明可以不用定制模板自动识别图纸内材料表内容,并支持无表格线,表格识别的效率和准确率较高。准确率较高。准确率较高。
技术研发人员:林希 宋楠 谢宏
受保护的技术使用者:北京互时科技股份有限公司
技术研发日:2022.06.27
技术公布日:2022/11/1