1.本技术涉及图像识别方法,尤其涉及一种基于深度学习的天车图像识别方法和系统,属于天车图像识别技术领域。
背景技术:2.工业天车在生产过程中,需要天车技术人员对其进行操作,要求技术人员能够驾驶天车进行货物的抓取与存放工作。由于天车工作环境的恶劣,危险系数高,就需要对天车实现智能化升级,逐渐将智能化设备添加到天车系统中,实现自动运行。传统的天车运行是由操作人员在驾驶室内进行操作,但是由于目标受环境的干扰以及操作人员长时间工作带来的疲劳,就导致操作人员不能每次都能够精准的找到目标的位置,就需要用智能化设备来代替人眼来工作。并且天车的运行是一个重复性动作,但对每一个目标的识别以及目标的定位却是一个实时更新的过程,就需要在短时间内识别出目标并给出相应的坐标位置。
3.因此就需要一种能够在各种环境下对目标进行检测的技术,将现场的目标准确地递给天车,来实现天车自动化、智能化运行。
技术实现要素:4.为解决现有技术中存在的人工驾驶天车抓取和存放不精准的技术问题,本发明提供一种基于深度学习的天车图像识别方法和系统。
5.方案一:一种基于深度学习的天车图像识别方法,包括以下步骤:
6.s1.获取天车运行时的目标图像;
7.s2.筛选目标图像,并将目标图像进行归一化处理;
8.s3.提取目标图像特征;
9.s4.构建并训练网络模型;
10.s5.将目标图像输入网络模型中,输出抓取目标,计算目标坐标,根据目标坐标实现天车抓取。
11.优选的,s1所述获取天车运行时的目标图像的方法是:天车上安装有摄像系统,天车运行的过程中直接抓取目标图像。
12.优选的,s2所述筛选目标图像,并将目标图像进行归一化处理的方法是:下述公式:
13.输出=(输入-最小输入)/(最大输入-最小输入)
14.其中,输出表示图像的像素值输出,输入表示图像的像素值输入,最大输入表示图像的最大像素值;最小输入表示图像的最小像素值。
15.优选的,s3所述提取目标图像特征的方法是:调整图像的对比度,计算每个图像上的像素梯度,进行弱化光照的干扰,通过亚像素处理,得到电石锅的轮廓。
16.优选的,s4构建网络模型的方法是:包括第一层卷积层、第二层卷积层、第三层卷积层、第四层卷积层、第五层卷积层、第六层全连接层和第七层输出层;
17.所述第一层卷积层包括两个卷积核,第一个卷积核大小为7*7,第二个卷积核的大小为5*5,convl-1与convl-2的卷积个数均为96个,步长均为2,在5*5卷积核上进行一个像素单位填充;
18.所述第二层卷积层使用大小为27*27的卷积核,将卷积核分为两组,每组含有128个卷积核,步长为2;
19.所述第三层卷积层使用大小为13*13的卷积核,将卷积核分为两组,每组含有192个卷积核,步长为2;
20.所述第四层卷积层使用大小为13*13的卷积核,将卷积核分为两组,每组含有192个卷积核,步长为2;
21.所述第五层卷积层包括池化和卷积核,使用大小为13*13的卷积核,将卷积核分为两组,每组128个卷积核,对激活之后的结果进行窗口为3*3的最大池化操作,池化步长为 2;
22.所述第六层连接层,对第五层卷积层进行全连接处理,并进行dropout操作,设定参数为0.5;
23.优选的,s4所述网络模型使用relu激活函数。
24.方案二、一种基于深度学习的天车图像识别系统,用于实现方案一所述一种基于深度学习的天车图像识别方法的系统,包括图像获取模型、图像处理模块、图像识别模块、目标计算模块和天车调度模块;
25.所述图像获取模型用于获取天车运行时的目标图像;
26.所述图像处理模块用于筛选目标图像,并将目标图像进行归一化处理;
27.所述图像识别模块用于识别抓取目标图像;
28.所述目标计算模块用于计算抓取目标图像坐标;
29.所述天车调度模块用于控制天车实现自动抓取。
30.本发明的有益效果如下:解决现有技术中存在的人工驾驶天车抓取和存放不精准的技术问题,实现了降低网络模型的深度还能够提高模型特征提取的能力。模型深度是影响模型识别时间长短的关键因素,因此本发明提高了天车抓取和存放精准的效果还缩短了识别目标图像的时间,提高了识别目标的效率。
附图说明
31.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
32.图1为方法流程示意图;
33.图2为网络模型结构示意图;
34.图3为训练模型时的超参数以及损失函数示意图;
35.图4为系统结构示意图。
具体实施方式
36.为了使本技术实施例中的技术方案及优点更加清楚明白,以下结合附图对本技术的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本技术的一部分实施
例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
37.实施例1、参照图1-图4说明本实施方式,一种基于深度学习的天车图像识别方法,包括以下步骤:
38.s1.获取天车运行时的目标图像的方法是:天车上安装有摄像系统,天车运行的过程中直接抓取目标图像。
39.s2.筛选目标图像,并将目标图像进行归一化处理的方法是:图像归一化操作是为了是模型加快收敛,对图像进行归一化操作,是把不同维度特征值调整到相似的范围内,方便使用统一的学习率加速模型的训练,公式如下:
40.输出=(输入-最小输入)/(最大输入-最小输入)
41.其中,输出:图像的像素值输出(将像素值调整到0~1之间),输入:图像的像素值输入,最大输入和最小输入:为图像的最大、最小像素值。
42.s3.提取目标图像特征的方法是:首先进行灰度化处理,调整图像的对比度,计算每个图像上的像素梯度,进行弱化光照的干扰,然后通过亚像素处理,得到电石锅的轮廓。
43.灰度化图像是指黑白图像中的点的颜色深度,0~255.采用最大值法,将彩色图像中得三份量亮度得最大值作为灰度图得灰度值。采用灰度直方图变换得方法调整图像得对比度。
44.s4.构建并训练网络模型;
45.构建网络模型的方法是:包括第一层卷积层、第二层卷积层、第三层卷积层、第四层卷积层、第五层卷积层、第六层全连接层和第七层输出层;
46.所述第一层卷积层包括两个卷积核,第一个卷积核大小为7*7,第二个卷积核的大小为5*5,convl-1与convl-2的卷积个数均为96个,步长均为2,在5*5卷积核上进行一个像素单位填充;
47.所述第二层卷积层使用大小为27*27的卷积核,将卷积核分为两组,每组含有128个卷积核,步长为2;
48.所述第三层卷积层使用大小为13*13的卷积核,将卷积核分为两组,每组含有192个卷积核,步长为2;
49.所述第四层卷积层使用大小为13*13的卷积核,将卷积核分为两组,每组含有192个卷积核,步长为2;
50.所述第五层卷积层包括池化和卷积核,使用大小为13*13的卷积核,将卷积核分为两组,每组128个卷积核,对激活之后的结果进行窗口为3*3的最大池化操作,池化步长为 2;
51.所述第六层连接层,对第五层卷积层进行全连接处理,并进行dropout操作,设定参数为0.5;
52.所述网络模型使用relu激活函数。
53.s5.将目标图像输入网络模型中,输出抓取目标,计算目标坐标,根据目标坐标实现天车抓取。
54.实施例2、参照图4说明本实施方式,一种基于深度学习的天车图像识别系统,包括图像获取模型、图像处理模块、图像识别模块、目标计算模块和天车调度模块;
55.所述图像获取模型用于获取天车运行时的目标图像;
56.所述图像处理模块用于筛选目标图像,并将目标图像进行归一化处理;
57.所述图像识别模块用于识别抓取目标图像;
58.所述目标计算模块用于计算抓取目标图像坐标;
59.所述天车调度模块用于控制天车实现自动抓取。
60.尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
技术特征:1.一种基于深度学习的天车图像识别方法,其特征在于,包括以下步骤:s1.获取天车运行时的目标图像;s2.筛选目标图像,并将目标图像进行归一化处理;s3.提取目标图像特征;s4.构建并训练网络模型;s5.将目标图像输入网络模型中,输出抓取目标,计算目标坐标,根据目标坐标实现天车抓取。2.根据权利要求1所述的一种基于深度学习的天车图像识别方法,其特征在于,s1所述获取天车运行时的目标图像的方法是:天车上安装有摄像系统,天车运行的过程中直接抓取目标图像。3.根据权利要求2所述的一种基于深度学习的天车图像识别方法,其特征在于,s2所述筛选目标图像,并将目标图像进行归一化处理的方法是:下述公式:输出=(输入-最小输入)/(最大输入-最小输入)其中,输出表示图像的像素值输出,输入表示图像的像素值输入,最大输入表示图像的最大像素值;最小输入表示图像的最小像素值。4.根据权利要求3所述的一种基于深度学习的天车图像识别方法,其特征在于,s3所述提取目标图像特征的方法是:调整图像的对比度,计算每个图像上的像素梯度,进行弱化光照的干扰,通过亚像素处理,得到电石锅的轮廓。5.根据权利要求4所述的一种基于深度学习的天车图像识别方法,其特征在于,s4构建网络模型的方法是:包括第一层卷积层、第二层卷积层、第三层卷积层、第四层卷积层、第五层卷积层、第六层全连接层和第七层输出层;所述第一层卷积层包括两个卷积核,第一个卷积核大小为7*7,第二个卷积核的大小为5*5,convl-1与convl-2的卷积个数均为96个,步长均为2,在5*5卷积核上进行一个像素单位填充;所述第二层卷积层使用大小为27*27的卷积核,将卷积核分为两组,每组含有128个卷积核,步长为2;所述第三层卷积层使用大小为13*13的卷积核,将卷积核分为两组,每组含有192个卷积核,步长为2;所述第四层卷积层使用大小为13*13的卷积核,将卷积核分为两组,每组含有192个卷积核,步长为2;所述第五层卷积层包括池化和卷积核,使用大小为13*13的卷积核,将卷积核分为两组,每组128个卷积核,对激活之后的结果进行窗口为3*3的最大池化操作,池化步长为2;所述第六层连接层,对第五层卷积层进行全连接处理,并进行dropout操作,设定参数为0.5。6.根据权利要求5所述的一种基于深度学习的天车图像识别方法,其特征在于,s4所述网络模型使用relu激活函数。7.一种基于深度学习的天车图像识别系统,其特征在于,用于实现权利要求1-6任一项所述一种基于深度学习的天车图像识别方法的系统,包括图像获取模型、图像处理模块、图像识别模块、目标计算模块和天车调度模块;
所述图像获取模型用于获取天车运行时的目标图像;所述图像处理模块用于筛选目标图像,并将目标图像进行归一化处理;所述图像识别模块用于识别抓取目标图像;所述目标计算模块用于计算抓取目标图像坐标;所述天车调度模块用于控制天车实现自动抓取。
技术总结本发明提出一种基于深度学习的天车图像识别方法和系统,属于天车图像识别技术领域。包括以下步骤:S1.获取天车运行时的目标图像;S2.筛选目标图像,并将目标图像进行归一化处理;S3.提取目标图像特征;S4.构建并训练网络模型;S5.将目标图像输入网络模型中,输出抓取目标,计算目标坐标,根据目标坐标实现天车抓取。解决现有技术中存在的人工驾驶天车抓取和存放不精准的技术问题,实现了降低网络模型的深度还能够提高模型特征提取的能力。模型深度是影响模型识别时间长短的关键因素,因此本发明提高了天车抓取和存放精准的效果还缩短了识别目标图像的时间,提高了识别目标的效率。提高了识别目标的效率。提高了识别目标的效率。
技术研发人员:谭建勋 张佳乐 许国安 韩守国 李菲菲 李承伟 赵子豪
受保护的技术使用者:哈尔滨博实自动化股份有限公司
技术研发日:2022.06.23
技术公布日:2022/11/1