1.本发明属于图像处理技术领域,具体涉及一种行人重识别图像的处理方法及 系统。
背景技术:2.行人重识别(person re-identification,简称re-id)技术是一种根据行人全 身信息,旨在解决不同时间不同地点下同一行人匹配问题的技术。其可以弥补固 定摄像头的视觉局限,在商超、机场等安保领域具有广泛的应用价值。
3.re-id的网络设计中常常会引入注意力模块,以提高模型对跨摄像头下行人 不变性特征的重点挖掘。如公开号为cn111368815a的专利文献公开的一种基于 多部件自注意力机制的行人重识别方法,该方法首先预训练深度卷积神经网络骨 干模型;然后对骨干模型进行分支后构建多部件自注意力网络,获得多部件自注 意力特征;接着将多部件自注意力特征输入分类器,联合训练最小化交叉熵损失 和度量损失;最后将测试集图片输入训练好的模型,融合输出的部件特征获得整 体特征,经度量排序实现行人重识别。该专利提出了多部件自注意力机制,自注 意力模块使网络更充分细致地关注具有判别特性的区域就,其中空间注意力模块 和通道注意力模块以残差的形式融入网络,使得网络更加健壮稳定,容易训练。 然而,现有的注意力模块大都存在以下几点缺陷:
4.1)大多数注意力模块都选择全局平均池化来生成各个特征图通道或空间位 置的权重描述符,虽然保留了全局信息的完整性,但是没有突出显著性信息对描 述符的引导作用。
5.2)多数注意力模块的设计过于复杂,最直接的表现就是计算量大幅增加。
技术实现要素:6.本发明的目的在于提供一种行人重识别图像的处理方法及系统,本发明通过 平均池化与全局池化相结合的方式聚合待处理特征图的空间信息,并以通过互补 性加权的方式同时融合了全局平均信息和局部显著性信息,能够推断出更精细的 通道注意力掩码,从而增强了通道特征之间的相互依赖关系并得到特征增强的特 征图,同时整个处理过程还有效控制计算量的增加。
7.为实现上述目的,本发明采用的技术方案如下:
8.一种行人重识别图像的处理方法,其特征在于包括如下步骤:
9.步骤a:给定待处理特征图,分别使用全局平均池化和全局最大池化聚合待 处理特征图的空间信息,生成第一空间上下文描述符和第二空间上下文描述符;
10.步骤b:分别对第一空间上下文描述符和第二空间上下文描述符进行挤压
‑ꢀ
激励操作,得到第一中间注意力掩码和第二中间注意力掩码;
11.步骤c:分别结合权重向量对第一中间注意力掩码和第二中间注意力掩码进 行自适应加权融合,再将融合掩码通过crb复合卷积层进行特征细节处理,得 到注意力混合掩
码;
12.步骤d:对注意力混合掩码进行挤压-激励操作,得到注意力最终掩码;
13.步骤e:将注意力最终掩码与待处理特征图进行逐通道相乘,得到特征增强 的特征图。
14.所述挤压-激励操作由挤压操作和激励操作两步串联组成,挤压操作用于将 空间上下文描述符的通道数压缩为原来的1/r,r为缩放因子,激励操作用于将被 压缩的通道数还原;其中,步骤b中的挤压操作和激励操作分别基于两个crb 复合卷积层实现,步骤d中的挤压操作和激励操作分别基于crb复合卷积层和 cbs复合卷积层实现。
15.所述crb复合卷积层由滤波器conv1d、激活函数relu和bn层组成,所 述cbs复合卷积层由滤波器conv1d、bn层和sigmoid函数组成。
16.步骤a中,设定待处理特征图为f,第一空间上下文描述符和第二空间上下 文描述符分别为f
avg
和f
max
,则:
[0017][0018][0019]
式中,u(i,j)表示待处理特征图坐标(i,j)处的像素值;c、h和w分别表示待 处理特征图的通道数、高度和宽度。
[0020]
步骤b中,设定第一中间注意力掩码和第二中间注意力掩码分别为f
′
avg
和 f
′
max
,则:
[0021][0022][0023]
式中,f
sq-ex
(
·
)表示挤压-激励操作。
[0024]
步骤c中,设定与第一中间注意力掩码和第二中间注意力掩码相对应的权 重向量分别为wc×1和(1c×
1-wc×1),融合掩码为f
′
fus
,注意力混合掩码为m,则:
[0025][0026]
m=conv(f
′
fus
),m∈rc×1×1[0027]
其中,
[0028]
pi,qi∈[0,1]且pi+qi=1
[0029][0030]
式中,
·
表示逐通道相乘;表示通道合并操作;-表示逐通道相减;p、q 分别表示权重向量wc×1和(1c×
1-wc×1);pi、qi分别表示权重向量p、q中第i通道 处相对应的一对元素;分别表示实数向量x
avg
、x
max
中第i通道处相 对应的一对元素,x
avg
、x
max
即为实际
训练时所要学习的两个参数向量;conv表 示crb复合卷积层。
[0031]
步骤d中,设定注意力最终掩码为m
′
,则:
[0032][0033]
式中,表示挤压-激励操作。
[0034]
步骤e中,设定特征增强的特征图为f
′
,则:
[0035][0036]
式中,表示逐通道相乘。
[0037]
一种行人重识别图像的处理系统,其特征在于:包括自监督重标定块和神经 网络模型,所述自监督重标定块包括图像输入模块、平均池化模块、最大池化模 块、第一挤压-激励模块、第二挤压-激励模块、第三挤压-激励模块、加权融合模 块、crb复合卷积模块和图像输出模块,其中,
[0038]
图像输入模块用于输入待处理特征图;
[0039]
平均池化模块用于聚合待处理特征图的空间信息,并生成第一空间上下文描 述符;
[0040]
最大池化模块用于聚合待处理特征图的空间信息,并生成第二空间上下文描 述符;
[0041]
第一挤压-激励模块用于对第一空间上下文描述符分别进行挤压操作和激励 操作,并得到第一中间注意力掩码;
[0042]
第二挤压-激励模块用于对第二空间上下文描述符分别进行挤压操作和激励 操作,并得到第二中间注意力掩码;
[0043]
加权融合模块用于分别结合权重向量对第一中间注意力掩码和第二中间注 意力掩码进行自适应加权融合,并得融合掩码;
[0044]
crb复合卷积模块用于对融合掩码进行特征细节处理,并得到注意力混合 掩码;
[0045]
第三挤压-激励模块用于对注意力混合掩码分别进行挤压操作和激励操作, 并得到注意力最终掩码;
[0046]
图像输出模块用于将注意力最终掩码与待处理特征图进行逐通道相乘,得到 特征增强的特征图;
[0047]
所述神经网络模型用于对特征增强的特征图进行处理,并输出识别结果。
[0048]
所述挤压操作用于将空间上下文描述符的通道数压缩为原来的1/r,r为缩放 因子,所述激励操作用于将被压缩的通道数还原;其中,在第一挤压-激励模块 和第二挤压-激励模块中,挤压操作和激励操作分别基于两个crb复合卷积层实 现;在第三挤压-激励模块中,挤压操作和激励操作分别基于crb复合卷积层和 cbs复合卷积层实现;所述crb复合卷积层由滤波器conv1d、激活函数relu 和bn层组成,所述cbs复合卷积层由滤波器conv1d、bn层和sigmoid函数 组成。
[0049]
采用上述技术方案,本发明的有益技术效果是:
[0050]
1.本发明所述行人重识别图像的处理方法包括五个步骤,其中,
[0051]
步骤a分别使用全局平均池化和全局最大池化聚合待处理特征图的空间信 息,并生成第一空间上下文描述符和第二空间上下文描述符;其优点在于同时使 用全局平均池
化和全局最大池化可以兼顾特征信息的完整性和特异性。
[0052]
步骤b和步骤d通过挤压-激励操作一方面可以增强描述符的跨通道信息交 互,提升非线性表达能力,从而使中间注意力掩码的通道依赖关系得到充分交互, 另一方面可通过调节描述符的通道维度来有效控制计算量,也使得后续滤波器的 计算量大幅降低。
[0053]
步骤c通过自适应加权融合可以根据实际任务自主确定第一中间注意力掩 码和第二中间注意力掩码的重要程度。采用crb复合卷积层一是便于进一步处 理特征细节,提升非线性表达能力;二是用以压缩融合掩码的通道维度,用以降 低后续的计算量。
[0054]
步骤e中的逐通道相乘就是特征“重标定”的过程,最终掩码将待处理特 征图中目标的显著性特征进行增强并抑制不重要的特征。
[0055]
综合而言,本发明采用了平均池化与全局池化相结合的方式,一方面,能够 推断更精细的通道注意力掩码,并以互补性加权的方式自主地重新校准通道方向 的特征响应,从而增强通道特征之间的相互依赖关系,达到对目标自身不变性特 征的挖掘和构建;另一方面,为了缓解计算量的增加,可以通过“挤压-激励
”ꢀ
操作来传递特征,既可以对特征进行非线性处理,又可以对特征图的通道数加以 控制,从而显著约束自身的计算成本。
[0056]
2.本发明通过挤压-激励操作能够加强各个掩码的特征丰富度,同时可有效控 制计算量的增加。
[0057]
另外,步骤b中的挤压操作和激励操作分别基于两个crb复合卷积层实现, 步骤d中的挤压操作和激励操作分别基于crb复合卷积层和cbs复合卷积层 实现。需要说明的是,crb复合卷积层由conv1d
‑‑
》relu
‑‑
》bn顺序的常规层 组成,除了加工特征,主要还有调节通道维度的作用。特别地,滤波器conv1d 和激活函数relu的联合使用能够让模型充分学习通道特征之间的非线性相互 作用,bn层在负责约束数据分布的同时加快了收敛。另外,本发明将bn层放 在激活函数relu后面,避免了relu的非负响应使权重层以次优的方式更新。 而cbs采用conv1d
‑‑
》bn
‑‑
》sigmoid的顺序,conv1d负责加工特征和调节通道 维度,bn层用于加快sr收敛,sigmoid函数将注意力掩码的取值映射到[0,1] 区间从而作为重标定因子(即注意力最终掩码)。
[0058]
3本发明步骤c中分别结合权重向量对第一中间注意力掩码和第二中间注意 力掩码进行自适应加权融合,其融合方式为cat(通道合并)而非add(元素相 加),有效地避免了直接相加容易造成特征混淆的问题出现。
[0059]
4.本发明的权重向量和注意力最终掩码的生成完全依赖网络的自适应学习, 在训练过程中,对参数的选取进行监督,从而自主对第一中间注意力掩码和第二 中间注意力掩码进行权重分配。
附图说明
[0060]
图1为本发明的流程图;
[0061]
图2为本发明的原理图;
[0062]
图3为本发明中crb复合卷积层的结构图;
[0063]
图4为本发明中挤压-激励操作的原理图;
[0064]
图5为本发明中挤压-激励操作的详细原理图;
[0065]
图6为本发明中自适应加权融合的原理图;
图7为本发明中sr块与resnet-50中残差单元的集成方案图;图8为本发明中resnet-50和sr-resnet-50的详细配置图。
具体实施方式
[0066]
实施例1
[0067]
本实施例公开了一种行人重识别图像的处理方法,如图1、2所示,其包括 如下步骤:
[0068]
步骤a:给定待处理特征图,分别使用全局平均池化和全局最大池化聚合待 处理特征图的空间信息,生成第一空间上下文描述符和第二空间上下文描述符。
[0069]
具体的,设定待处理特征图为f,第一空间上下文描述符和第二空间上下文 描述符分别为f
avg
和f
max
,则第一空间上下文描述符和第二空间上下文描述符生 成方式为:
[0070][0071][0072]
式中,u(i,j)表示待处理特征图坐标(i,j)处的像素值;c、h和w分别表示待 处理特征图的通道数、高度和宽度。
[0073]
步骤b:分别对第一空间上下文描述符和第二空间上下文描述符进行挤压
‑ꢀ
激励操作,完成后得到第一中间注意力掩码和第二中间注意力掩码。
[0074]
具体的,设定第一中间注意力掩码和第二中间注意力掩码分别为f
′
avg
和f
′
max
, 则第一中间注意力掩码和第二中间注意力掩码的得到方式为:
[0075][0076][0077]
式中,f
sq-ex
(
·
)表示挤压-激励操作;两个f
sq-ex
(
·
)的操作流程相同但不共享参 数。
[0078]
本步骤关于挤压-激励操作需要说明的是,挤压-激励操作由挤压操作和激励 操作两步串联组成,挤压操作用于将空间上下文描述符的通道数压缩为原来的 1/r,r为缩放因子,缩放因子r的设置可根据实验结果进行相应调整,激励操作 用于将被压缩的通道数还原。如图4所示,它可以通过调节缩放因子r来控制通 道维度,从而增加或降低模型的容量。通过挤压-激励操作,注意力掩码的通道 依赖关系得到充分交互,也使得后续滤波器的计算量大幅降低。
[0079]
步骤c:分别结合权重向量对第一中间注意力掩码和第二中间注意力掩码进 行自适应加权融合,再将融合掩码通过crb复合卷积层进行特征细节处理,得 到注意力混合掩码。如图3所示,crb复合卷积层由1*1核尺寸的滤波器conv1d、 激活函数relu和bn层组成,即由conv1d
‑‑
》relu
‑‑
》bn顺序的常规层组成, 1*1核尺寸的卷积层不会改变特征图的尺寸,其主要作用是加强特征图的跨通道 信息交互,特征细节处理主要是指每次只处理特征图上1*1的小范围细节信息。
[0080]
具体的,如图6所示,设定与第一中间注意力掩码和第二中间注意力掩码相 对应的权重向量分别为wc×1和(1c×
1-wc×1),融合掩码为f
′
fus
,注意力混合掩码为m,则注意力混合掩码的得到方式为:
[0081][0082]
m=conv(f
′
fus
),m∈rc×1×1[0083]
其中,
[0084]
pi,qi∈[0,1]且pi+qi=1
[0085][0086]
式中,
·
表示逐通道相乘;表示通道合并操作;-表示逐通道相减;p、q 分别表示权重向量wc×1和(1c×
1-wc×1);pi、qi分别表示权重向量p、q中第i通道 处相对应的一对元素;分别表示实数向量x
avg
、x
max
中第i通道处相 对应的一对元素,x
avg
、x
max
即为实际训练时所要学习的两个参数向量;conv表 示crb复合卷积层。在实际的训练过程中,权重向量会进行空间维度的广播(复 制),以便在代码中进行逐元素操作。
[0087]
需要说明的是,本步骤在实施过程中巧妙地引入了softmax函数,将网络学 习的参数约束在区间[0,1],即:
[0088][0089]
此时,网络对权重向量p和q的学习问题就转化为分别对两个实数向量x
avg
和x
max
的学习。
[0090]
步骤d:对注意力混合掩码进行挤压-激励操作,得到注意力最终掩码。
[0091]
具体的,设定注意力最终掩码为m
′
,则注意力最终掩码的得到方式为:
[0092][0093]
式中,表示挤压-激励操作。
[0094]
步骤e:将注意力最终掩码与待处理特征图进行逐通道相乘,得到特征增强 的特征图。
[0095]
具体的,设定特征增强的特征图为f
′
,则特征增强的特征图的得到方式为:
[0096][0097]
式中,表示逐通道相乘。
[0098]
同样,在实际训练过程中,注意力最终掩码m
′
会首先沿特征图空间维度 (h
×
w)进行相应的广播(复制),由维度rc×1×1变成rc×h×w,从而进行逐元素 操作。
[0099]
另外,关于挤压-激励操作需要说明的是,步骤b中的挤压操作和激励操作 分别基于两个crb复合卷积层实现,步骤d中的挤压操作和激励操作分别基于 crb复合卷积层和
cbs复合卷积层实现。crb复合卷积层由滤波器conv1d、 激活函数relu和bn层组成,与上述步骤c中相同。cbs复合卷积层由滤波 器conv1d、bn层和sigmoid函数组成,即由conv1d
‑‑
》bn
‑‑
》sigmoid顺序的常 规层组成。需要注意的是,如图5所示,步骤b中和步骤d中需要都经过了相 同形式的挤压-激励操作,但各挤压-激励操作的参数并不共享。
[0100]
进一步的,如图5所示,除了步骤d中的挤压-激励操作外,每个挤压-激励 操作的基本单元都是如图3的crb复合卷积层。优选的,各crb复合卷积层和 cbs复合卷积层中的conv1d均为尺寸为1*1的一维卷积(其本质等价于全连接 层)。在crb复合卷积层中,滤波器conv1d和激活函数relu的联合使用能 够让模型充分学习特征图通道之间的非线性相互作用,bn层在负责约束数据分 布的同时加快了收敛。当然,本发明对滤波器conv1d的核尺寸不作限定,具体 可根据实际需要相应设置。
[0101]
本实施例在实际实施时,假设输入的待处理特征图f的维度为c*h*w,则 其经历的过程为:
[0102]
(1)分别进行全局平均池化操作和全局最大池化操作,分别得到维度均为 c*1*1的第一空间上下文描述符f
avg
和第二空间上下文描述符f
max
。
[0103]
(2)f
avg
、f
max
分别进行挤压和激励操作,分别得到维度均为c*1*1的第 一中间注意力掩码f
′
avg
和第二中间注意力掩码f
′
max
。
[0104]
(3)f
′
avg
和f
′
max
分别和维度均为c*1*1的权重向量p、q进行逐通道相乘, 然后两者的结果进行通道合并,得到维度为2c*1*1的融合掩码f
′
fus
。
[0105]
(4)f
′
fus
进行crb复合卷积层操作,得到维度为c*1*1的注意力混合掩码 m。
[0106]
(5)m进行挤压和激励操作,得到维度为c*1*1的注意力最终掩码m
′
。
[0107]
(6)m
′
(c*1*1)和f(c*h*w)进行逐通道相乘,得到维度为c*h*w 的增强后的特征图。在实际训练时,m
′
首先会沿空间维度广播(复制),将维 度变换为c*h*w,然后和维度为c*h*w的f进行逐元素相乘,最终得到特征 增强的特征图为f
′
。
[0108]
相对于最开始输入的待处理特征图f,其最终得到的特征增强的特征图为f
′ꢀ
增强了待处理特征图的尺度多样性和语义丰富度,从而能够更准确地获取待处理 特征图中的相关特征。
[0109]
实施例2
[0110]
本实施例公开了一种行人重识别图像的处理系统,其包括自监督重标定块和 神经网络模型,所述神经网络模型包括但不限于vggnet系列、resnet系列、 mobilenet系列神经网络模型,所述自监督重标定(self-supervised recalibration, sr)块可简称sr块,其具体包括图像输入模块、平均池化模块、最大池化模块、 第一挤压-激励模块、第二挤压-激励模块、第三挤压-激励模块、加权融合模块、 crb复合卷积模块和图像输出模块。其中,
[0111]
图像输入模块用于输入待处理特征图。
[0112]
平均池化模块用于聚合待处理特征图的空间信息,并生成第一空间上下文描 述符。
[0113]
最大池化模块用于聚合待处理特征图的空间信息,并生成第二空间上下文描 述符。
[0114]
第一挤压-激励模块用于对第一空间上下文描述符分别进行挤压操作和激励 操作,并得到第一中间注意力掩码。
[0115]
第二挤压-激励模块用于对第二空间上下文描述符分别进行挤压操作和激励 操作,并得到第二中间注意力掩码。
[0116]
加权融合模块用于分别结合权重向量对第一中间注意力掩码和第二中间注 意力掩码进行自适应加权融合,并得融合掩码。
[0117]
crb复合卷积模块用于对融合掩码进行特征细节处理,并得到注意力混合 掩码。
[0118]
第三挤压-激励模块用于对注意力混合掩码分别进行挤压操作和激励操作, 并得到注意力最终掩码。
[0119]
图像输出模块用于将注意力最终掩码与待处理特征图进行逐通道相乘,得到 特征增强的特征图。
[0120]
所述神经网络模型用于对特征增强的特征图进行处理,并输出识别结果。
[0121]
需要说明的是,所述挤压操作用于将空间上下文描述符的通道数压缩为原来 的1/r,r为缩放因子,缩放因子r的设置均需要根据实验结果进行相应调整,以 使sr块在网络模型中发挥最优作用。所述激励操作用于将被压缩的通道数还原; 其中,在第一挤压-激励模块和第二挤压-激励模块中,挤压操作和激励操作分别 基于两个crb复合卷积层实现;在第三挤压-激励模块中,挤压操作和激励操作 分别基于crb复合卷积层和cbs复合卷积层实现;所述crb复合卷积层由滤 波器conv1d、激活函数relu和bn层组成,所述cbs复合卷积层由滤波器 conv1d、bn层和sigmoid函数组成。
[0122]
本实施例中的sr块是个即插即用的特征增强模块,可以灵活地插入到 vggnet系列、resnet系列、mobilenet系列等所有通用的主干网络中,形成srnet 实例化模型,进而用于re-id任务。
[0123]
例如,若使用resnet-50网络模型用于行人重识别,输入为行人图片,输出 为行人重识别的结果。当在resnet-50中某位置插入sr块后,则可称之为 sr-resnet-50网络模型,它的机理在于:同样输入为行人图片,当输入信息流经 过sr块后,其图像特征就会得到增强,然后增强后的特征继续向后传递,输出 为行人重识别的结果。同理,换成vggnet网络也是这样。
[0124]
下面,本实施例给出一种sr块与最通用resnet-50的集成方案。由图7所 示,本实施例将sr块插入到resnet-50中残差单元的“非线性操作”之后,与
ꢀ“
恒等映射分支”求和之前,并称之为sr-resnet-50,详细配置如图8所示,此 时sr-resnet-50中sr块的缩放因子r设置为16。
[0125]
同样,将sr块与其他通用的主干网络进行集成时,均可以通过以上类似方 案构建,但需要说明的是在构建过程中sr块的集成位置、sr块缩放因子r的设 置均需要根据实验结果进行相应调整,以使sr块在网络中发挥最优作用。
[0126]
由表1可知,与resnet-50相比,sr-resnet-50在三个re-id公开数据集上 的精度均有不同程度的提升,尤其在遮挡数据集occluded-duke上的性能提升显 著。以在occluded-duke上的测试结果为例,使用sr块的sr-resnet-50在rank-1 上提升5.97%,而计算量仅比原来增加了0.052gflops(以单张256*128像素 的三通道彩色行人图像单次前向传播为例),计算量仅增加约1.3%。表明作为 对这种轻微额外计算负担的交换,sr-resnet-50在提高模型性能和增加模型计算 成本之间具有良好的权衡,充分证明了sr块设计的有效性。
[0127]
表1 sr-resnet-50与resnet-50在三个不同re-id数据集上的测试结果
[0128][0129]
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除 非特别叙述,均可被其他等效或具有类似目的替代特征加以替换;所公开的所有 特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可 以任何方式组合。
技术特征:其中,p
i
,q
i
∈[0,1]且p
i
+q
i
=1式中,
·
表示逐通道相乘;表示通道合并操作;-表示逐通道相减;p、q分别表示权重向量w
c
×1和(1
c
×
1-w
c
×1);p
i
、q
i
分别表示权重向量p、q中第i通道处相对应的一对元素;分别表示实数向量x
avg
、x
max
中第i通道处相对应的一对元素,x
avg
、x
max
即为实际训练时所要学习的两个参数向量;conv表示crb复合卷积层。7.根据权利要求1所述的一种行人重识别图像的处理方法,其特征在于:步骤d中,设定注意力最终掩码为m
′
,则:式中,表示挤压-激励操作。8.根据权利要求1所述的一种行人重识别图像的处理方法,其特征在于:步骤e中,设定特征增强的特征图为f
′
,则:式中,表示逐通道相乘。9.一种行人重识别图像的处理系统,其特征在于:包括自监督重标定块和神经网络模型,所述自监督重标定块包括图像输入模块、平均池化模块、最大池化模块、第一挤压-激励模块、第二挤压-激励模块、第三挤压-激励模块、加权融合模块、crb复合卷积模块和图像输出模块,其中,图像输入模块用于输入待处理特征图;平均池化模块用于聚合待处理特征图的空间信息,并生成第一空间上下文描述符;最大池化模块用于聚合待处理特征图的空间信息,并生成第二空间上下文描述符;第一挤压-激励模块用于对第一空间上下文描述符分别进行挤压操作和激励操作,并得到第一中间注意力掩码;第二挤压-激励模块用于对第二空间上下文描述符分别进行挤压操作和激励操作,并得到第二中间注意力掩码;加权融合模块用于分别结合权重向量对第一中间注意力掩码和第二中间注意力掩码进行自适应加权融合,并得融合掩码;crb复合卷积模块用于对融合掩码进行特征细节处理,并得到注意力混合掩码;第三挤压-激励模块用于对注意力混合掩码分别进行挤压操作和激励操作,并得到注意力最终掩码;图像输出模块用于将注意力最终掩码与待处理特征图进行逐通道相乘,得到特征增强的特征图;所述神经网络模型用于对特征增强的特征图进行处理,并输出识别结果。10.根据权利要求9所述的一种行人重识别图像的处理系统,其特征在于:所述挤压操作用于将空间上下文描述符的通道数压缩为原来的1/r,r为缩放因子,所述激励操作用于
将被压缩的通道数还原;其中,在第一挤压-激励模块和第二挤压-激励模块中,挤压操作和激励操作分别基于两个crb复合卷积层实现;在第三挤压-激励模块中,挤压操作和激励操作分别基于crb复合卷积层和cbs复合卷积层实现;所述crb复合卷积层由滤波器conv1d、激活函数relu和bn层组成,所述cbs复合卷积层由滤波器conv1d、bn层和sigmoid函数组成。
技术总结本发明公开了一种行人重识别图像的处理方法及系统,所述系统包括自监督重标定块和神经网络模型,所述自监督重标定块包括图像输入模块、平均池化模块、最大池化模块、第一挤压-激励模块、第二挤压-激励模块、第三挤压-激励模块、加权融合模块、CRB复合卷积模块和图像输出模块;所述方法基于系统实现。本发明通过平均池化与全局池化相结合的方式聚合待处理特征图的空间信息,并以通过互补性加权的方式同时融合了全局平均信息和局部显著性信息,能够推断出更精细的通道注意力掩码,从而增强了通道特征之间的相互依赖关系并得到特征增强的特征图,同时整个处理过程还有效控制计算量的增加。增加。增加。
技术研发人员:候少麒 王治国 殷光强 董志华 毛俊怡
受保护的技术使用者:电子科技大学
技术研发日:2022.07.04
技术公布日:2022/11/1