从二维图像中提取学者与机构关系的方法和装置与流程

专利2024-12-04  52



1.本技术涉及图像识别技术领域,尤其涉及一种从二维图像中提取学者与机构关系的方法和装置。


背景技术:

2.在移动互联网时代,手机成为人人都有的计算设备。大部分手机拍照app,可以通过拍照提取二维图像中的文字。但是却不能识别出二维图像中的学者名称,同时无法提取出学者所属的机构组织。


技术实现要素:

3.本技术旨在至少在一定程度上解决相关技术中的技术问题之一。
4.为此,本技术的第一个目的在于提出一种从二维图像中提取学者与机构关系的方法,解决了现有方法的无法识别出二维图像中的学者名称与学者所属的机构组织的技术问题,通过识别实体并计算实体之间的距离,能够提取出二维图像中的学者与机构,并且建立起对应的关系,并且能够一次性提取多个学者机构关系对,以使搜索效率远高于手工搜索。
5.本技术的第二个目的在于提出一种从二维图像中提取学者与机构关系的装置。
6.本技术的第三个目的在于提出一种计算机设备。
7.本技术的第四个目的在于提出一种非临时性计算机可读存储介质。
8.为达上述目的,本技术第一方面实施例提出了一种从二维图像中提取学者与机构关系的方法,包括:获取二维图像;提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标机构实体,并根据学者名实体和目标机构实体构造实体对;根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。
9.可选地,在本技术的一个实施例中,提取二维图像中的实体,并获取实体对应的坐标和区域大小,包括:
10.使用卷积神经网络识别二维图像中的文字与文字所在区域的坐标;
11.将文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取二维图片中的实体;
12.将实体与文字所在区域的坐标匹配,得到实体对应的坐标和区域大小。
13.可选地,在本技术的一个实施例中,根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离,包括:
14.分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离。
15.可选地,在本技术的一个实施例中,分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离,包
括:
16.分别选取学者名实体和机构实体对应的所有预设位置的坐标点;
17.计算两两配对的学者名实体所有预设位置的坐标点和机构实体所有预设位置的坐标点之间的距离,并计算距离的平均值,将平均值作为学者名实体和机构实体的实体距离。
18.可选地,在本技术的一个实施例中,计算两个坐标点距离的公式表示为:
[0019][0020]
其中,d
1,2
为坐标点1和坐标点2之间的距离,x1为坐标点1的x轴坐标,x2为坐标点2的x轴坐标,y1为坐标点1的y轴坐标,y2为坐标点2的y轴坐标。
[0021]
为达上述目的,本技术第二方面实施例提出了一种从二维图像中提取学者与机构关系的装置,包括:
[0022]
获取模块,用于获取二维图像;
[0023]
实体提取模块,用于提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;
[0024]
计算模块,用于根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;
[0025]
构造模块,用于根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标机构实体,并根据学者名实体和目标机构实体构造实体对;
[0026]
检索模块,用于根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。
[0027]
可选地,在本技术的一个实施例中,实体提取模块,具体用于:
[0028]
使用卷积神经网络识别二维图像中的文字与文字所在区域的坐标;
[0029]
将文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取二维图片中的实体;
[0030]
将实体与文字所在区域的坐标匹配,得到实体对应的坐标和区域大小。
[0031]
可选地,在本技术的一个实施例中,计算模块,具体用于:
[0032]
分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离。
[0033]
为达上述目的,本技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述施例所述的从二维图像中提取学者与机构关系的方法。
[0034]
为了实现上述目的,本技术第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,能够执行一种从二维图像中提取学者与机构关系的方法。
[0035]
本技术实施例的从二维图像中提取学者与机构关系的方法、装置、计算机设备和非临时性计算机可读存储介质,解决了现有方法的无法识别出二维图像中的学者名称与学者所属的机构组织的技术问题,通过识别实体并计算实体之间的距离,能够提取出二维图像中的学者与机构,并且建立起对应的关系,并且能够一次性提取多个学者机构关系对,以使搜索效率远高于手工搜索。
[0036]
本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
[0037]
本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0038]
图1为本技术实施例一所提供的一种从二维图像中提取学者与机构关系的方法的流程示意图;
[0039]
图2为本技术实施例的从二维图像中提取学者与机构关系的方法另一个流程图;
[0040]
图3为本技术实施例二所提供的一种从二维图像中提取学者与机构关系的装置的结构示意图。
具体实施方式
[0041]
下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
[0042]
二维图像,经过数字化处理后,实则是一个二维的数字矩阵。卷积神经网络,可以从二维图像中提取出更多的隐式特征,相比之前的图像计算方法,有了质的飞跃。卷积神经网络,经过海量的图片与文字训练后,能够以95%以上的准确率从二维图像中识别出文字内容,并标记出文字所在区域的坐标与空间大小。命名实体识别技术,是自然语言处理的一项基础技术,可以从非结构化的文字中提取出人名与机构名等。相比早期的基于规则与字典方法,或是后来的隐马尔可夫模型等传统的机器学习方法,基于深度学习与条件随机场有更高的准确性。此时实体虽然被识别出来,但是还不能区分出来学者名与机构,同时两者不能建立起来关联。
[0043]
本技术根据建立的文字区域坐标,计算实体的坐标与区域,然后两两比较学者名称实体与机构实体块之间的距离。将距离近的实体对,视为存在对应关系。使用aminer网站的全体学者信息库建立倒排索引,根据前面建立的学者、机构对检索,找出存在的纪录,以提取出二维图像中的学者名,以及其所属的机构。
[0044]
下面参考附图描述本技术实施例的从二维图像中提取学者与机构关系的方法和装置。
[0045]
图1为本技术实施例一所提供的一种从二维图像中提取学者与机构关系的方法的流程图。
[0046]
如图1所示,该从二维图像中提取学者与机构关系的方法包括以下步骤:
[0047]
步骤101,获取二维图像,
[0048]
步骤102,提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;
[0049]
步骤103,根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;
[0050]
步骤104,根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标
机构实体,并根据学者名实体和目标机构实体构造实体对;
[0051]
步骤105,根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。
[0052]
本技术实施例的从二维图像中提取学者与机构关系的方法,通过获取二维图像;提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标机构实体,并根据学者名实体和目标机构实体构造实体对;根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。由此,能够解决了现有方法的无法识别出二维图像中的学者名称与学者所属的机构组织的技术问题,通过识别实体并计算实体之间的距离,能够提取出二维图像中的学者与机构,并且建立起对应的关系,并且能够一次性提取多个学者机构关系对,以使搜索效率远高于手工搜索。本技术通过使用深度学习、自然语言处理技术、基础几何、搜索技术、图像切割相结合的计算方法,能够成功从二维图像中提取出学者名称及其所属的机构组织。
[0053]
本技术实施例中,获取的二维图像可以为拍摄得到的照片,或是过往的照片。
[0054]
进一步地,在本技术实施例中,提取二维图像中的实体,并获取实体对应的坐标和区域大小,包括:
[0055]
使用卷积神经网络识别二维图像中的文字与文字所在区域的坐标;
[0056]
将文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取二维图片中的实体;
[0057]
将实体与文字所在区域的坐标匹配,得到实体对应的坐标和区域大小。
[0058]
本技术实施例中,对获取的二维图像进行数字化编码,并将经过数字化编码的二维图像,传入卷积神经网络。根据二维图像的大小,选择不同的过滤器。二维图像最长的边的不能超过4096像素,分别使用5x5,8x8,28x28的过滤器。经过卷积神经网络的计算,最终可以得到二维图像中的文字与所在区域的坐标。
[0059]
将文字进行合并后,传入双向长短记忆循环神经网络与条件随机场模型,提取出其中的实体。将实体与文字区域匹配,找出实体对应的区域与大小。
[0060]
进一步地,在本技术实施例中,根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离,包括:
[0061]
分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离。
[0062]
本技术实施例中,将提取出的学者名实体与机构实体分为两个群体,两个群体两两比较计算距离,得到任意学者名实体和任意机构实体之间的实体距离。
[0063]
进一步地,在本技术实施例中,分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离,包括:
[0064]
分别选取学者名实体和机构实体对应的所有预设位置的坐标点;
[0065]
计算两两配对的学者名实体所有预设位置的坐标点和机构实体所有预设位置的坐标点之间的距离,并计算距离的平均值,将平均值作为学者名实体和机构实体的实体距离。
[0066]
本技术实施例,分别选取学者名实体和机构实体对应的所有预设位置的坐标点,
可以为分别选取学者名实体和机构实体对应的上、下、左、右、上左、上右、下左、下右八个坐标点。
[0067]
本技术实施例中,计算两两配对的学者名实体所有预设位置的坐标点和机构实体所有预设位置的坐标点之间的距离,可以为首先计算学者名实体的第一个坐标点与机构实体的第一个坐标点的距离,记录得到的距离;计算学者名实体的第一个坐标点与机构实体的第二个坐标点的距离,记录得到的距离;迭代计算,直至得到学者名实体的第一个坐标点与机构实体的所有坐标点的距离。然后计算学者名实体的第二个坐标点与机构实体的第一个坐标点的距离,记录得到的距离;计算学者名实体的第二个坐标点与机构实体的第二个坐标点的距离,记录得到的距离;迭代计算,直至得到学者名实体的第二个坐标点与机构实体的所有坐标点的距离。根据上述步骤,迭代计算,直至得到学者名实体的所有坐标点与机构实体的所有坐标点的距离。
[0068]
计算上述得到的距离的平均值,将平均值作为学者名实体和机构实体的实体距离。
[0069]
进一步地,在本技术实施例中,计算两个坐标点距离的公式表示为:
[0070][0071]
其中,d
1,2
为坐标点1和坐标点2之间的距离,x1为坐标点1的x轴坐标,x2为坐标点2的x轴坐标,y1为坐标点1的y轴坐标,y2为坐标点2的y轴坐标。
[0072]
本技术实施例中,将距离近的实体,对视为存在对应关系,并以此关联学者名称实体与机构实体,构建实体对。示例性的,可以根据学者名实体和机构实体的实体距离,为每个学者名实体取距离最小的前五个机构实体,并构造为五个学者名实体和机构实体的实体对。
[0073]
本技术实施例中,使用aminer学者库建立的倒排索引,检索实体对是否存在。如果存在则保留作为目标实体对,否则就抛弃,其中,目标实体对为从二维图像中提取出的学者名与机构关系对。可以理解的是,本技术可以一次从二维图像中提取出的多位学者名及其所属的机构组织。
[0074]
图2为本技术实施例的从二维图像中提取学者与机构关系的方法另一个流程图。
[0075]
如图2所示,该从二维图像中提取学者与机构关系的方法包括,获取二维图像,使用卷积神经网络识别二维图像中的文字与文字所在区域的坐标;将文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取二维图片中的学者名实体与机构实体;计算实体对应的坐标和区域大小;两两计算学者名称实体与机构实体之间的距离;以将距离近的实体对视为存在对应关系为原则,关联学者名称实体与机构实体,构建实体对;使用aminer网站的全体学者信息库建立倒排索引,根据建立的学者、机构实体对检索,找出存在的纪录,以筛选合格的学者、机构实体对。
[0076]
图3为本技术实施例二所提供的一种从二维图像中提取学者与机构关系的装置的结构示意图。
[0077]
如图3所示,该从二维图像中提取学者与机构关系的装置,包括:
[0078]
获取模块10,用于获取二维图像;
[0079]
实体提取模块20,用于提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;
[0080]
计算模块30,用于根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;
[0081]
构造模块40,用于根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标机构实体,并根据学者名实体和目标机构实体构造实体对;
[0082]
检索模块50,用于根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。
[0083]
本技术实施例的从二维图像中提取学者与机构关系的装置,包括获取模块,用于获取二维图像;实体提取模块,用于提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;计算模块,用于根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;构造模块,用于根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标机构实体,并根据学者名实体和目标机构实体构造实体对;检索模块,用于根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。由此,能够解决了现有方法的无法识别出二维图像中的学者名称与学者所属的机构组织的技术问题,通过识别实体并计算实体之间的距离,能够提取出二维图像中的学者与机构,并且建立起对应的关系,并且能够一次性提取多个学者机构关系对,以使搜索效率远高于手工搜索。本技术通过使用深度学习、自然语言处理技术、基础几何、搜索技术、图像切割相结合的计算方法,能够成功从二维图像中提取出学者名称及其所属的机构组织。
[0084]
进一步地,在本技术实施例中,实体提取模块,具体用于:
[0085]
使用卷积神经网络识别二维图像中的文字与文字所在区域的坐标;
[0086]
将文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取二维图片中的实体;
[0087]
将实体与文字所在区域的坐标匹配,得到实体对应的坐标和区域大小。
[0088]
进一步地,在本技术实施例中,计算模块,具体用于:
[0089]
分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离。
[0090]
为了实现上述实施例,本技术还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述施例所述的从二维图像中提取学者与机构关系的方法。
[0091]
为了实现上述实施例,本技术还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例的从二维图像中提取学者与机构关系的方法。
[0092]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0093]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性
或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0094]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0095]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0096]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0097]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0098]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0099]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:
1.一种从二维图像中提取学者与机构关系的方法,其特征在于,包括以下步骤:获取二维图像;提取所述二维图像中的实体,并获取所述实体对应的坐标和区域大小,其中,所述实体包括学者名实体和机构实体;根据所述实体对应的坐标和区域大小计算所述学者名实体和机构实体之间的实体距离;根据所述实体距离从所述机构实体中选择与所述学者名实体对应的预设数量的目标机构实体,并根据所述学者名实体和所述目标机构实体构造实体对;根据所述实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。2.如权利要求1所述的方法,其特征在于,所述提取所述二维图像中的实体,并获取所述实体对应的坐标和区域大小,包括:使用卷积神经网络识别所述二维图像中的文字与文字所在区域的坐标;将所述文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取所述二维图片中的实体;将所述实体与文字所在区域的坐标匹配,得到所述实体对应的坐标和区域大小。3.如权利要求1所述的方法,其特征在于,根据所述实体对应的坐标和区域大小计算所述学者名实体和机构实体之间的实体距离,包括:分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离。4.如权利要求3所述的方法,其特征在于,所述分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离,包括:分别选取学者名实体和机构实体对应的所有预设位置的坐标点;计算两两配对的学者名实体所有预设位置的坐标点和机构实体所有预设位置的坐标点之间的距离,并计算所述距离的平均值,将所述平均值作为所述学者名实体和机构实体的实体距离。5.如权利要求1所述的方法,其特征在于,计算两个坐标点距离的公式表示为:其中,d
1,2
为坐标点1和坐标点2之间的距离,x1为坐标点1的x轴坐标,x2为坐标点2的x轴坐标,y1为坐标点1的y轴坐标,y2为坐标点2的y轴坐标。6.一种从二维图像中提取学者与机构关系的装置,其特征在于,包括:获取模块,用于获取二维图像;实体提取模块,用于提取所述二维图像中的实体,并获取所述实体对应的坐标和区域大小,其中,所述实体包括学者名实体和机构实体;计算模块,用于根据所述实体对应的坐标和区域大小计算所述学者名实体和机构实体之间的实体距离;构造模块,用于根据所述实体距离从所述机构实体中选择与所述学者名实体对应的预设数量的目标机构实体,并根据所述学者名实体和所述目标机构实体构造实体对;
检索模块,用于根据所述实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。7.如权利要求6所述的装置,其特征在于,实体提取模块,具体用于:使用卷积神经网络识别所述二维图像中的文字与文字所在区域的坐标;将所述文字进行合并,并将合并后的文字输入双向长短记忆循环神经网络与条件随机场模型,提取所述二维图片中的实体;将所述实体与文字所在区域的坐标匹配,得到所述实体对应的坐标和区域大小。8.如权利要求6所述的装置,其特征在于,计算模块,具体用于:分别在学者名实体和机构实体所在区域选取坐标点,通过计算各个坐标点之间的距离得到学者名实体和机构实体之间的实体距离。9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5中任一所述的方法。10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一所述的方法。

技术总结
本申请提出了一种从二维图像中提取学者与机构关系的方法,其中,该方法包括:获取二维图像;提取二维图像中的实体,并获取实体对应的坐标和区域大小,其中,实体包括学者名实体和机构实体;根据实体对应的坐标和区域大小计算学者名实体和机构实体之间的实体距离;根据实体距离从机构实体中选择与学者名实体对应的预设数量的目标机构实体,并根据学者名实体和目标机构实体构造实体对;根据实体对进行检索,筛选存在于学者库中的实体对作为目标实体对。本申请可以提取出二维图像中的学者与机构,并且建立起对应的关系,并且能够一次性提取多个学者机构关系对,提高了搜索效率。提高了搜索效率。提高了搜索效率。


技术研发人员:彭晓涛 张鹏
受保护的技术使用者:北京智谱华章科技有限公司
技术研发日:2022.06.30
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-10689.html

最新回复(0)