一种神经类型测试卷的智能阅卷方法、装置及终端设备

专利2024-10-11  58



1.本技术属于试卷智能识别技术领域,尤其涉及一种神经类型测试卷的智能阅卷方法、装置及终端设备。


背景技术:

2.大脑皮层神经细胞兴奋和抑制过程具有强度、平衡性和灵活性。特殊行业在选才时会考虑神经类型并对其进行测试。神经类型测试方法有很多种,80.8神经类型量表法是一种神经系统类型的测试方法,该量表自提出以来,已被应用多年,成为一种重要的评估运动员选手神经类型的测试手段。
3.80.8神经类型量表根据人的大脑皮层机能能力的发展和皮层神经细胞兴奋与抑制过程的活动规律设计的。该表共包含十四种符号,共50行,40列,每行有40个符号。其中八种符号极其相似,六种符号差别明显。
4.目前,80.8神经类型测试卷的批改主要靠人工操作。人工批改神经类型测试卷的方式存在重复劳动、效率低下、耗时费力等问题。
5.当前已有的智能阅卷评分系统主要针对标准答题卡设计的。神经类型测试试卷是普通的纸质试卷形式,不能采用标准答题卡作答,对于非标准答题试卷的智能阅卷系统来说,从现有技术层次来看其基本过程包括:图像采集、图像区域分割、图像处理、信息提取、字符识别等。为了建立精细的分化抑制,80.8神经类型测试表中包含八种极其相似的符号,如图1所示为八种相似的符号,图2为六种差别明显的符号。如果测试者/阅卷者不仔细辨别,很难发现相似符号之间的差距。采用现有的智能阅卷处理方法,如图像处理、字符提取、字符识别比对等算法流程,很容易将这些相似字符间的细微差距模糊化或处理掉,这不利于相似字符信息间的提取,从而使智能阅卷过程不够准确。


技术实现要素:

6.为克服相关技术中存在的问题,本技术实施例提供了一种神经类型测试卷的智能阅卷方法、装置及终端设备,能够快速而准确地记录作答符号信息,方便计算机快速统计,减少误判情况的发生,极大提高符号识别准确率和效率。
7.本技术是通过如下技术方案实现的:
8.第一方面,本技术实施例提供了神经类型测试卷的智能阅卷方法,包括:获取神经类型测试卷的作答图像;对所述作答图像进行预处理;所述预处理包括调整所述作答图像的阅读方向、识别和保存作答者的身份信息以及定位所述作答图像中的试卷作答区域;基于神经类型测试卷和标准答案,构建标准答案的三元组字典;基于预处理后的作答图像,构建作答信息的三元组字典;其中,所述三元组字典包括多个三元组,每个三元组对应一个答案符号信息,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;将所述作答信息的三元组字典与所述标准答案的三元组字典进行比对、统计并记录作答信息。
9.在一种可能的实现方式中,所述调整所述作答图像的阅读方向,包括:
10.将所述作答图像的方向,调整至正常阅卷模式的方向;
11.所述身份信息包括姓名、性别、年龄信息;
12.所述定位试卷作答区域,包括:
13.先对所述神经类型测试卷的作答图像进行边缘检测、透视变换、畸变矫正,再定位所述作答图像的作答区域。
14.在一种可能的实现方式中,所述基于神经类型测试卷和标准答案,构建标准答案的三元组字典,包括:
15.通过
16.answer_key={(x,y,label)}
17.构建标准答案三元组字典,其中x,y是正整数,x表示答案符号所在试卷的行位置信息,y表示答案符号所在试卷的列位置信息,label代表答案符号的类别。
18.在一种可能的实现方式中,所述答案符号的类别label包括3种作答符号,所述3种作答符号分别为斜线(/或\)、圆圈(

)和对勾(√);定义圆圈的label值为0,斜线的label值等于1,对勾的label值为2。
19.在一种可能的实现方式中,所述基于预处理后的作答图像,构建作答信息的三元组字典,包括:
20.将预处理后的作答图像,由rgb空间转换到hsv颜色空间;所述预处理后的作答图像中,试卷部分为黑色符号,作答部分为红色作答符号;
21.将hsv颜色空间下的神经类型测试卷作答图像,进行处理分析;
22.经过所述处理分析后,通过将所述试卷作答区域的图像的每一个作答符号信息构建为一个三元组,将整套神经类型测试卷的作答信息一一映射到三元组字典上,构建作答信息的三元组字典。
23.在一种可能的实现方式中,所述将预处理后的作答图像,由rgb空间转换到hsv颜色空间,包括:
24.将预处理后的作答图像的rgb空间转换到hsv颜色空间,并将hsv颜色空间分离,提取所述红色作答符号的h、s和v各分量;
25.基于分离的hsv颜色空间,构建两个颜色集合,所述两个颜色集合包括集合color1与集合color2,然后计算color1和color2的并集;其中,集合color1中h、s和v的下限是lower1=[156,43,46],上限upper1=[180,255,255];color2中h、s和v的下限lower2=[0,43,46],上限upper2=[10,255,255]。
[0026]
在一种可能的实现方式中,所述将hsv颜色空间下的神经类型测试卷作答图像,进行处理分析,包括:
[0027]
将所述hsv颜色空间下的神经类型测试卷作答图像,进行中值滤波去噪处理;
[0028]
对中值滤波后的神经类型测试卷作答图像进行膨胀,形态学闭运算,获取清晰、完整的作答区域图像;
[0029]
对所述作答区域图像进行边缘检测,定位所述作答区域图像。
[0030]
在一种可能的实现方式中,所述通过将所述作答区域图像的每一个作答符号信息构建为一个三元组,建立起整套神经类型测试卷的作答信息一一映射到三元组字典上,构
建作答信息的三元组字典,包括:
[0031]
通过
[0032]
cropimg=img[int(i*height_rect):int(i+1)*height_rect),int(j*width_rect):int(j+1)*width_rect)]
[0033]
将所述作答区域图像img按m行和n列分成m
×
n个图像子块;其中第i行,第j列图像子块;i从1到m,j从1到n,m是作答试卷表格的行数,n是试卷表格的列数;height_rect=img_height/m,width_rect=img_width/n,其中,img_height、img_width分别是所述作答区域图像的高度和宽度像素值;
[0034]
利用python的numpy.array()函数将每一个所述图像子块转换为数组格式im_arr;
[0035]
统计数组格式的每个所述图像子块中标记符号的面积,若所述标记符号的面积大于预设阈值,则判定为有效标记符号,否则判定为无效标记符号;
[0036]
利用霍夫变换判断所述有效标记符号的类别label,并计算出所述有效标记符号中心位置的坐标信息(x,y);
[0037]
基于所述有效标记符号的类别label和所述有效标记符号中心位置的坐标信息(x,y)构建符号信息三元组(x,y,label),将所有所述符号信息一一映射到作答符号三元组矩阵answer_test={(x,y,label)}构建作答信息的三元组字典。
[0038]
第二方面,本技术实施例提供了一种神经类型测试卷的智能阅卷装置,包括:获取模块,用于获取神经类型测试卷的作答图像;预处理模块,用于对所述作答图像进行预处理;所述预处理包括调整所述作答图像的阅读方向、识别和保存作答者的身份信息以及定位所述作答图像中的试卷作答区域;第一构建模块,用于基于神经类型测试卷和标准答案,构建标准答案的三元组字典;第二构建模块,用于基于预处理后的作答图像,构建作答信息的三元组字典;其中,所述三元组字典包括多个三元组,每个三元组对应一个答案符号信息,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;比对模块,用于将所述作答信息的三元组字典与所述标准答案的三元组字典进行比对、统计并记录作答信息。
[0039]
第三方面,本技术实施例提供了一种终端设备,包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法。
[0040]
第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的神经类型测试卷的智能阅卷方法。
[0041]
第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的方法。
[0042]
本技术实施例与现有技术相比存在的有益效果是:
[0043]
本技术实施例,利用对作答图像进行处理,实现的神经类型测试卷的智能化阅卷,极大程度改善人工阅卷耗时耗力的问题,而且减少误判情况的发生;构建三元组字典,并实现从试卷作答信息到三元组字典的一一映射,快速而准确地记录作答符号信息,方便计算机快速统计;与人工阅卷相比,本方法不对测试试卷中的符号作识别(人工阅卷不仅要认真
查看作答符号,还需要仔细辨别测试表格中每个符号,其中8个符号极其相似,字符不仅小而且比较密集,人工阅卷过程耗时费力),仅对测试标记符号检测和识别,实现对作答信息的快速提取与识别,极大提高符号识别准确率高和效率。
[0044]
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
[0045]
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
[0046]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1是本技术一实施例提供的80.8神经类型测试卷中八种相似符号;
[0048]
图2是本技术一实施例提供的80.8神经类型测试卷中六种差别明显符号;
[0049]
图3是本技术一实施例提供的神经类型测试卷的智能阅卷方法的流程示意图;
[0050]
图4是本技术一实施例提供的非正常阅卷模式的作答图像的示意图;
[0051]
图5是本技术一实施例提供的正常阅卷模式的作答图像的示意图;
[0052]
图6是本技术一实施例提供的获取的试卷图像作答区域的示意图;
[0053]
图7是本技术一实施例提供的矫正后的试卷图像作答区域的示意图;
[0054]
图8是本技术一实施例提供的rgb颜色空间变换到hsv颜色空间的作答图像的示意图;
[0055]
图9是本技术一实施例提供的处理分析后的作答图像的示意图;
[0056]
图10是本技术一实施例提供的神经类型测试卷的智能阅卷装置的结构示意图;
[0057]
图11是本技术一实施例提供的终端设备的结构示意图。
具体实施方式
[0058]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
[0059]
应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0060]
还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0061]
如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响
应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0062]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0063]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0064]
当前已有的智能阅卷评分系统主要针对标准答题卡设计的。神经类型测试试卷是普通的纸质试卷形式,不能采用标准答题卡作答,对于非标准答题试卷的智能阅卷系统来说,从现有技术层次来看其基本过程包括:图像采集、图像区域分割、图像处理、信息提取、字符识别等。为了建立精细的分化抑制,80.8神经类型测试表中包含八种极其相似的符号。如果测试者/阅卷者不仔细辨别,很难发现相似符号之间的差距。采用现有的智能阅卷处理方法,如图像处理、字符提取、字符识别比对等算法流程,很容易将这些相似字符间的细微差距模糊化或处理掉,这不利于相似字符信息间的提取,从而使智能阅卷过程不够准确。
[0065]
基于上述问题,本技术实施例中提供了神经类型测试卷的智能阅卷方法,获取神经类型测试卷的作答图像;对作答图像进行预处理;基于神经类型测试卷和标准答案,构建标准答案的三元组字典;基于预处理后的作答图像,构建作答信息的三元组字典;其中,三元组字典包括多个三元组,每个三元组对应一个答案符号,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;将作答信息的三元组字典与标准答案的三元组字典进行比对、统计并记录作答信息。本技术能够快速而准确地记录作答符号信息,方便计算机快速统计,减少误判情况的发生,极大提高符号识别准确率和效率。
[0066]
为了使本技术领域的人员更好地理解本发明方案,下面将结合附图和具体实施方式,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0067]
图3是本技术一实施例提供的神经类型测试卷的智能阅卷方法的示意性流程图,参照图3,对该神经类型测试卷的智能阅卷方法的详述如下:
[0068]
在步骤101中,获取神经类型测试卷的作答图像。
[0069]
一实施例中,将80.8神经类型测试试卷放置到扫描仪送纸区域,扫描完成的图像保存为jpg或是png格式。也可用手机拍摄神经类型测试卷。扫描或拍照后的图像保存到pc主机指定存储的文件夹里。该80.8神经类型测试试卷包括如图1所示的八种相似符号和和图2所示的六种差别明显符号;其中八种相似符号,差别非常细微。
[0070]
在步骤102中,对作答图像进行预处理;预处理包括调整作答图像的阅读方向、识别和保存作答者的身份信息以及定位作答图像中的试卷作答区域。
[0071]
具体的,先调整作答图像的阅读方向,包括:将作答图像的方向,调整至正常阅卷模式的方向;再识别和保存作答者的身份信息,身份信息包括姓名、性别、年龄信息;最后定位试卷作答区域,包括:先对神经类型测试卷的作答图像进行边缘检测、透视变换、畸变矫
正,再定位作答图像的作答区域。
[0072]
一实施例中,电脑读取神经类型测试卷图像,对神经类型测试表图像进行处理分析,以保证正常阅卷模式。
[0073]
示例性的,电脑读入作答图像,确认试卷是否为正常阅卷模式;如图4所示,作答图像为非正常阅卷模式;该作答图像中的试卷部分包含具有十四种符号的表格,表格共50行,40列,每行有40个符号,试卷部分还包含作答者的单位、姓名、性别、出生年月、民族、籍贯、身高、体重、文化程度、职业、特长和性格特点等身份信息;试卷部分还包含总阅符号数,应找符号数,得分和类型等判断情况;上述试卷部分内容均为黑色。该作答图像中的作答部分包含作答符号信息,该作答符号信息为红色,且以下内容涉及到的作答符号均为红色。
[0074]
对上述输入的神经类型测试卷图像旋转,这里逆时针旋转90度,如图5所示,将图4中的文字信息和符号旋转至相对竖直方向,保证试卷为正常阅卷模式。
[0075]
一实施例中,对试卷区域进行定位、分割,获取身份信息区域并进行文字识别。获取的身份信息包括:姓名、性别、年龄信息。对试卷进行边缘检测,定位试卷作答区域边界;对图像透视变换,畸变矫正,获取试卷图像作答区域。
[0076]
示例性的,为了提高图像处理速度,先将大尺寸图像缩小,这里缩小后的图像像素高度为500,宽度按原始图像尺寸比例大小进行缩放;然后对图像处理,包括把彩色图像转换为灰度图像、高斯滤波处理,canny边缘检测;再进行轮廓提取:遍历所有轮廓、计算近似轮廓、当近似轮廓中包含4个角点的时候即找到了试卷测试区域的最大外轮廓,如图6所示,其中矩形框600即为找到的最大外轮廓;最后将图像大小还原,利用python中的透视变换函数cv2.getperspectivetransform()进行透视变换,得到矫正后的试卷作答图像,即获得试卷图像作答区域,如图7所示,与图6相比,去掉了文字信息,获得矩形框600框住的含有十四种符号的表格。
[0077]
在步骤103中,基于神经类型测试卷和标准答案,构建标准答案的三元组字典。其中,三元组字典包括多个三元组,每个三元组对应一个答案符号,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别。
[0078]
具体的,基于神经类型测试卷和标准答案,构建标准答案的三元组字典,包括:
[0079]
通过
[0080]
answer_key={(x,y,label)}
[0081]
构建标准答案三元组字典,其中x,y是正整数,x表示答案符号所在试卷的行位置信息,y表示答案符号所在试卷的列位置信息,label代表答案符号的类别。
[0082]
具体的,答案符号的类别label包括3种作答符号,所述3种作答符号分别为斜线、圆圈和对勾;定义圆圈的label值为0,斜线的label值等于1,对勾的label值为2。
[0083]
在一实施例中,标准答案三元组字典answer_key={(x,y,label)},其中x,y是正整数,分别表示答案符号所在的行列位置信息,label代表答案符号的类别。80.8神经类型量表通常指定3种作答符号,斜线(/或\)、圆圈(

)和对勾(√)。这里,我们定义圆圈的label值为0,斜线的label值等于1,对勾的label值为2。为了提高计算效率,构建的信息表仅包含正确答案信息。
[0084]
一实施例中,标准答案三元组字典answer_key={(1,1,1),(1,35,0),(2,1,1),(2,24,0),(3,1,1),(3,23,0),(4,1,1),(4,37,0),(5,1,1),(5,39,0),(6,1,1),(6,5,0),
(7,1,1),(7,38,0),(8,1,1),(8,36,0),(9,1,1),(9,39,0),(10,1,1),(10,40,0),(11,1,1),(11,6,0),(12,1,1),(12,26,0),(13,1,1),(13,5,0),(14,1,1),(14,25,0),(15,1,1),(15,34,0),(16,1,1),(16,17,0),(17,1,1),(17,30,0),(18,1,1),(18,20,0),(19,1,1),(19,4,0),(20,1,1),(20,36,0),(21,1,1),(21,7,0),(22,1,1),(22,34,0),(23,1,1),(23,30,0),(24,1,1),(24,38,0),(25,1,1),(25,9,0),(26,1,1),(26,40,0),(27,1,1),(27,12,0),(28,1,1),(28,33,0),(29,1,1),(29,35,0),(30,1,1),(30,19,0),(31,1,1),(31,36,0),(32,1,1),(32,31,0),(33,1,1),(33,32,0),(34,1,1),(34,35,0),(35,1,1),(35,11,0),(36,1,1),(36,29,0),(37,1,1),(37,24,0),(38,1,1),(38,6,0),(39,1,1),(39,21,0),(40,1,1),(40,9,0),(41,1,1),(41,10,0),(42,1,1),(42,36,0),(43,1,1),(43,25,0),(44,1,1),(44,38,0),(45,1,1),(45,11,0),(46,1,1),(46,40,0),(47,1,1),(47,13,0),(48,1,1),(48,37,0),(49,1,1),(49,14,0),(50,1,1),(50,34,0),(50,40,2)}。
[0085]
一实施例中,构建上述标准答案三元组字典,可以是通过计算机识别标有正确答案的试卷,也可以是人为录入正确答案信息。
[0086]
在步骤104中,基于预处理后的作答图像,构建作答信息的三元组字典;其中,三元组字典包括多个三元组,每个三元组对应一个答案符号信息,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别。
[0087]
具体的,上述基于预处理后的作答图像,构建作答信息的三元组字典,具体包括3个步骤:
[0088]
步骤1:将预处理后的作答图像,由rgb空间转换到hsv颜色空间。
[0089]
步骤2:将hsv颜色空间下的神经类型测试卷作答图像,进行处理分析。
[0090]
步骤3:经过处理分析后,通过将试卷作答区域的图像的每一个作答符号信息构建为一个三元组,将整套神经类型测试卷的作答信息一一映射到三元组字典上,构建作答信息的三元组字典。
[0091]
示例性的,预处理后的作答图像中,试卷部分为黑色符号,作答部分为红色作答符号。
[0092]
在步骤1中,将预处理后的作答图像,由rgb空间转换到hsv颜色空间,包括:将预处理后的作答图像的rgb空间转换到hsv颜色空间,并将hsv颜色空间分离,提取所述红色作答符号的h、s和v各分量;
[0093]
基于分离的hsv颜色空间,构建两个颜色集合,所述两个颜色集合包括集合color1与集合color2,然后计算color1和color2的并集;其中,集合color1中h、s和v的下限是lower1=[156,43,46],上限upper1=[180,255,255];color2中h、s和v的下限lower2=[0,43,46],上限upper2=[10,255,255]。由rgb颜色空间变换到hsv颜色空间后的作答图像,如图8所示,作答图像中试卷部分为暗,作答符号为亮,能够清晰的将作答符号显示出来。
[0094]
另一实施例中,预处理后的作答图像中,试卷部分可以是黑色符号,作答部分可以是蓝色作答符号。将hsv颜色空间分离,提取蓝色作答符号的h、s和v各分量,修改蓝色集合h、s和v的限值即可,其它过程与作答部分为红色作答符号时相同。
[0095]
在步骤2中,将hsv颜色空间下的神经类型测试卷作答图像,进行处理分析,具体包括3个步骤:
[0096]
步骤21:将hsv颜色空间下的神经类型测试卷作答图像,进行中值滤波去噪处理。
[0097]
步骤22:对中值滤波后的神经类型测试卷作答图像进行膨胀,形态学闭运算,获取清晰、完整的作答区域图像。
[0098]
步骤23:对作答区域图像进行边缘检测,定位作答区域图像。示例性的,可以对img图像进行canny边缘检测。
[0099]
经过上述处理分析后的作答图像,如图9所示,作答图像中试卷部分为暗,作答符号更加明亮,能够使图8的作答符号更加清晰。
[0100]
在步骤3中,通过将作答区域图像的每一个作答符号信息构建为一个三元组,建立起整套神经类型测试卷的作答信息一一映射到三元组字典上,构建作答信息的三元组字典,包括:
[0101]
通过
[0102]
cropimg=img[int(i*height_rect):int(i+1)*height_rect),int(j*width_rect):int(j+1)*width_rect)]
[0103]
将作答区域图像img按m行和n列分成m
×
n个图像子块;其中第i行,第j列图像子块;i从1到m,j从1到n,m是作答试卷表格的行数,n是试卷表格的列数;height_rect=img_height/m,width_rect=img_width/n,其中,img_height、img_width分别是作答区域图像的高度和宽度像素值。
[0104]
利用python的numpy.array()函数将每一个图像子块转换为数组格式im_arr;统计数组格式的每个图像子块中标记符号的面积,若标记符号的面积大于预设阈值,则判定为有效标记符号,否则判定为无效标记符号。
[0105]
利用霍夫变换判断有效标记符号的类别label,并计算出有效标记符号中心位置的坐标信息(x,y);基于有效标记符号的类别label和有效标记符号中心位置的坐标信息(x,y)构建符号信息三元组(x,y,label),将所有符号信息一一映射到作答符号三元组矩阵answer_test={(x,y,label)},构建作答信息的三元组字典。
[0106]
一实施例中,每一个作答符号信息包含位置信息x,y和类别信息label。正确获取作答符号的位置信息和类别信息非常关键,这决定着阅卷系统的准确性。
[0107]
一实施例中,利用python中霍夫圆检测圆圈,其函数和参数为cv2.houghcircles(canny,cv2.hough_gradient,1,100,param1=100,param2=30,minradius=30,maxradius=120)。利用霍夫线变换检测斜线,其函数和参数为cv2.houghlinesp(canny,1,np.pi/180,100,minlinelength=50,maxlinegap=10)。根据霍夫变换得到标记符号的坐标信息(xpixel,ypixel)及其类别信息label,接下来,将坐标信息映射成标记符号的位置信息,其计算公式为x=int(xpixel/width_rect)+1;y=int(y/height_rect)+1,这里int()是对计算结果取整数。若检测到同一位置信息处(x,y)包含两条直线,这时需要计算检测到的直线的斜率,若两条直线的斜率为一负数和一正数,且负数的中心点在正数的中心点左边,则判定该符号为对勾,其标签label=2。
[0108]
在步骤105中,将作答信息的三元组字典与标准答案的三元组字典进行比对、统计并记录作答信息。
[0109]
一实施例中,首先,找到作答信息中类别标签是2的三元组(x,y,2),这是记录总阅览符号数标记位置。总阅符号数suma的计算方法是:suma=(x-1)*n+y,其中,n=40。其次,
统计作答信息中类别标签是0或1的三元组,若在标准答案的三元组字典中,则正确标记个数增加1,反之,错误标记个数增加1。漏检个数等于标准答案三元组字典中元素总个数减去正确标记个数。
[0110]
可见本发明利用图像处理技术实现的神经类型测试表智能化阅卷方法,极大程度改善人工阅卷耗时耗力的问题,而且减少误判情况的发生;构建三元组字典,并实现从试卷作答信息到三元组字典的一一映射,快速而准确地记录作答符号信息,方便计算机快速统计;与人工阅卷相比,本方法不对测试试卷中的符号作识别(人工阅卷不仅要认真查看作答符号,还需要仔细辨别测试表格中每个符号,其中8个符号极其相似,字符不仅小而且比较密集,人工阅卷过程耗时费力),仅对测试标记符号检测和识别,极大提高符号识别准确率高和效率;作答符号与测试表中的个别符号有重复,通过颜色空间变换过滤掉测试表中的符号,实现对作答信息的快速提取与识别。
[0111]
应理解,上述各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0112]
对应于上文实施例的神经类型测试卷的智能阅卷方法,图10示出了本技术实施例提供的神经类型测试卷的智能阅卷装置的结构框图,为了便于说明,仅示出了与本技术实施例相关的部分。
[0113]
参见图10,本技术实施例中的神经类型测试卷的智能阅卷装置可以包括获取模块201、预处理模块202、第一构建模块203、第二构建模块204和比对模块205。
[0114]
其中,获取模块201,用于获取神经类型测试卷的作答图像;预处理模块202,用于对作答图像进行预处理;预处理包括调整作答图像的阅读方向、识别和保存作答者的身份信息以及定位作答图像中的试卷作答区域;第一构建模块203,用于基于神经类型测试卷和标准答案,构建标准答案的三元组字典;第二构建模块204,用于基于预处理后的作答图像,构建作答信息的三元组字典;其中,三元组字典包括多个三元组,每个三元组对应一个答案符号,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;比对模块205,用于将作答信息的三元组字典与标准答案的三元组字典进行比对、统计并记录作答信息。
[0115]
需要说明的是,上述装置之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0116]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0117]
本技术实施例还提供了一种终端设备,参见图11,该终端设备300可以包括:至少一个处理器310和存储器320,所述存储器320中存储有可在所述至少一个处理器310上运行
的计算机程序,所述处理器310执行所述计算机程序时实现上述任意各个方法实施例中的步骤,例如图3所示实施例中的步骤101至步骤105。或者,处理器310执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图10所示模块201至205的功能。
[0118]
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器320中,并由处理器310执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序段,该程序段用于描述计算机程序在终端设备300中的执行过程。
[0119]
本领域技术人员可以理解,图11仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。
[0120]
处理器310可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0121]
存储器320可以是终端设备的内部存储单元,也可以是终端设备的外部存储设备,例如插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。所述存储器320用于存储所述计算机程序以及终端设备所需的其他程序和数据。所述存储器320还可以用于暂时地存储已经输出或者将要输出的数据。
[0122]
总线可以是工业标准体系结构(industry standard architecture,isa)总线、外部设备互连(peripheral component,pci)总线或扩展工业标准体系结构(extended industry standard architecture,eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本技术附图中的总线并不限定仅有一根总线或一种类型的总线。
[0123]
本技术实施例提供的神经类型测试卷的智能阅卷方法可以应用于计算机、平板电脑、笔记本电脑、上网本、个人数字助理(personal digital assistant,pda)等终端设备上,本技术实施例对终端设备的具体类型不作任何限制。
[0124]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述神经类型测试卷的智能阅卷方法各个实施例中的步骤。
[0125]
本技术实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述神经类型测试卷的智能阅卷方法各个实施例中的步骤。
[0126]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可
以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
[0127]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0128]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0129]
在本技术所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0130]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0131]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。

技术特征:
1.一种神经类型测试卷的智能阅卷方法,其特征在于,包括:获取神经类型测试卷的作答图像;对所述作答图像进行预处理;所述预处理包括调整所述作答图像的阅读方向、识别和保存作答者的身份信息以及定位所述作答图像中的试卷作答区域;基于神经类型测试卷和标准答案,构建标准答案的三元组字典;基于预处理后的作答图像,构建作答信息的三元组字典;其中,所述三元组字典包括多个三元组,每个三元组对应一个答案符号信息,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;将所述作答信息的三元组字典与所述标准答案的三元组字典进行比对、统计并记录作答信息。2.如权利要求1所述的神经类型测试卷的智能阅卷方法,其特征在于,所述调整所述作答图像的阅读方向,包括:将所述作答图像的方向,调整至正常阅卷模式的方向;所述身份信息包括姓名、性别、年龄信息;所述定位试卷作答区域,包括:先对所述神经类型测试卷的作答图像进行边缘检测、透视变换、畸变矫正,再定位所述作答图像的作答区域。3.如权利要求1所述的神经类型测试卷的智能阅卷方法,其特征在于,所述基于神经类型测试卷和标准答案,构建标准答案的三元组字典,包括:通过answer_key={(x,y,label)}构建标准答案三元组字典,其中x,y是正整数,x表示答案符号所在试卷的行位置信息,y表示答案符号所在试卷的列位置信息,label代表答案符号的类别。4.如权利要求1所述的神经类型测试卷的智能阅卷方法,其特征在于,所述答案符号的类别包括3种作答符号,所述3种作答符号分别为斜线、圆圈和对勾;定义圆圈的label值为0,斜线的label值等于1,对勾的label值为2。5.如权利要求1所述的神经类型测试卷的智能阅卷方法,其特征在于,所述基于预处理后的作答图像,构建作答信息的三元组字典,包括:将预处理后的作答图像,由rgb空间转换到hsv颜色空间;所述预处理后的作答图像中,试卷部分为黑色符号,作答部分为红色作答符号;将hsv颜色空间下的神经类型测试卷作答图像,进行处理分析;经过所述处理分析后,通过将所述试卷作答区域的图像的每一个作答符号信息构建为一个三元组,将整套神经类型测试卷的作答信息一一映射到三元组字典上,构建作答信息的三元组字典。6.如权利要求5所述的神经类型测试卷的智能阅卷方法,其特征在于,所述将预处理后的作答图像,由rgb空间转换到hsv颜色空间,包括:将预处理后的作答图像的rgb空间转换到hsv颜色空间,并将hsv颜色空间分离,提取所述红色作答符号的h、s和v各分量;基于分离的hsv颜色空间,构建两个颜色集合,所述两个颜色集合包括集合color1与集
合color2,然后计算color1和color2的并集;其中,集合color1中h、s和v的下限是lower1=[156,43,46],上限upper1=[180,255,255];color2中h、s和v的下限lower2=[0,43,46],上限upper2=[10,255,255]。7.如权利要求5所述的神经类型测试卷的智能阅卷方法,其特征在于,所述将hsv颜色空间下的神经类型测试卷作答图像,进行处理分析,包括:将所述hsv颜色空间下的神经类型测试卷作答图像,进行中值滤波去噪处理;对中值滤波后的神经类型测试卷作答图像进行膨胀,形态学闭运算,获取清晰、完整的作答区域图像;对所述作答区域图像进行边缘检测,定位所述作答区域图像。8.如权利要求5所述的神经类型测试卷的智能阅卷方法,其特征在于,所述通过将所述作答区域图像的每一个作答符号信息构建为一个三元组,将整套神经类型测试卷的作答信息一一映射到三元组字典上,构建作答信息的三元组字典,包括:通过cropimg=img[int(i*height_rect):int(i+1)*height_rect),int(j*width_rect):int(j+1)*width_rect)]将所述作答区域图像img按m行和n列分成m
×
n个图像子块;其中第i行,第j列图像子块;i从1到m,j从1到n,m是作答试卷表格的行数,n是试卷表格的列数;height_rect=img_height/m,width_rect=img_width/n,其中,img_height、img_width分别是所述作答区域图像的高度和宽度像素值;利用python的numpy.array()函数将每一个所述图像子块转换为数组格式im_arr;统计数组格式的每个所述图像子块中标记符号的面积,若所述标记符号的面积大于预设阈值,则判定为有效标记符号,否则判定为无效标记符号;利用霍夫变换判断所述有效标记符号的类别label,并计算出所述有效标记符号中心位置的坐标信息(x,y);基于所述有效标记符号的类别label和所述有效标记符号中心位置的坐标信息(x,y)构建符号信息三元组(x,y,label),将所有所述符号信息一一映射到作答符号三元组矩阵answer_test={(x,y,label)},构建作答信息的三元组字典。9.一种神经类型测试卷的智能阅卷装置,其特征在于,包括:获取模块,用于获取神经类型测试卷的作答图像;预处理模块,用于对所述作答图像进行预处理;所述预处理包括调整所述作答图像的阅读方向、识别和保存作答者的身份信息以及定位所述作答图像中的试卷作答区域;第一构建模块,用于基于神经类型测试卷和标准答案,构建标准答案的三元组字典;第二构建模块,用于基于预处理后的作答图像,构建作答信息的三元组字典;其中,所述三元组字典包括多个三元组,每个三元组对应一个答案符号信息,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;比对模块,用于将所述作答信息的三元组字典与所述标准答案的三元组字典进行比对、统计并记录作答信息。10.一种终端设备,包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一
项所述的神经类型测试卷的智能阅卷方法。

技术总结
本申请适用于试卷智能识别技术领域,提供了一种神经类型测试卷的智能阅卷方法、装置及终端设备,该方法包括:获取神经类型测试卷的作答图像;对作答图像进行预处理;基于神经类型测试卷和标准答案,构建标准答案的三元组字典;基于预处理后的作答图像,构建作答信息的三元组字典;其中,三元组字典包括多个三元组,每个三元组对应一个答案符号信息,三元组包括该答案符号所在的行位置信息、列位置信息以及答案符号的类别;将作答信息的三元组字典与标准答案的三元组字典进行比对、统计并记录作答信息。本申请能够快速而准确地记录作答符号信息,方便计算机快速统计,减少误判情况的发生,极大提高符号识别准确率和效率。极大提高符号识别准确率和效率。极大提高符号识别准确率和效率。


技术研发人员:陈宏彩 程煜 任亚恒 郝存明
受保护的技术使用者:河北省科学院应用数学研究所
技术研发日:2022.06.30
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-9903.html

最新回复(0)