基于深度学习的轨道角动量模态识别方法

专利2023-02-08  152



1.本发明涉及自由空间光通信领域,更为具体的,涉及一种基于深度学习的轨道角动量模态识别方法。


背景技术:

2.近年来,自由空间涡旋光通信因为其通信容量和频谱效率在国内外引起了众多学者的研究兴趣。涡旋光的轨道角动量本征态相互正交,并且理论上可以通过复用产生无穷多种轨道角动量叠加态,为光通信提供了一种新的通信维度,将光通信中携带信息的载体从光信号的振幅、偏振、频率和相位等推广到了轨道角动量。
3.自由空间涡旋光通信作为自由空间光通信的一种,相较于射频无线通信和光缆光纤通信,不仅有更大的通信容量,还能快速构建通信链路,具有大容量、高速率、覆盖范围广的特点。在自由空间涡旋光通信系统中,涡旋光通信系统发射端主要组件包括激光器、空间光调制器、编码器等,负责对信息序列进行编码并将其调制到涡旋光束上;接收端主要组件包括空间光调制器和译码器,负责解调涡旋光束和对编码序列进行译码。以不同的轨道角动量(oam)态来搭载信息,接收端解调涡旋光束来解码恢复信息序列。然而,由于涡旋光在传输过程中会受到大气湍流扰动畸变的影响,轨道角动量态发生弥散,引发了模间串扰现象,严重影响通信性能。因此,对于涡旋光在大气湍流中传输的oam识别是提升通信性能的重要研究内容之一。


技术实现要素:

4.本发明的目的在于克服现有技术的不足,提供一种基于深度学习的轨道角动量模态识别方法,有效利用相似多模态叠加涡旋波相似光强图中的细微差异等细节信息,在骨干网络后添加注意力机制的双路径结构,有效提升了涡旋光oam检测准确率。
5.本发明的目的是通过以下方案实现的:
6.一种基于深度学习的轨道角动量模态识别方法,包括:
7.s1,构建仿真数据集;
8.s2,构建深度学习模型:包括构造注意力金字塔卷积神经网络,用于提升涡旋光轨道角动量模态的检测准确率;
9.s3,训练基于构造注意力金字塔卷积神经网络的深度学习模型;
10.s4,将测试数据集输入训练好的深度学习模型,识别涡旋光在不同湍流情形下传输后的轨道角动量模态,获取识别准确率和误码率。
11.进一步地,在步骤s2中,所述注意力金字塔卷积神经网络为在resnet50网络后添加结合注意力金字塔的双路径算法结构,为一个两级网络,分别以粗略的完整图像和精细的局部特征作为输入,在这两个阶段,定义为原始阶段和细化阶段,共享参数和网络结构,分别从完整图像输入和局部特征输入中提取信息,并采用双路径算法结构和感兴趣区域roi引导的特征细化来提高性能;并且,原始阶段和细化阶段都设置了单独的分类器,最终
分类结果取原始阶段预测值和细化阶段预测值的平均值。
12.进一步地,在步骤s2中,包括子步骤:
13.s21,所述注意力金字塔卷积神经网络以完整图像为输入,包括在cnn网络的基础上改进得到的双路径算法结构;所述双路径算法结构包括自顶向下的特征路径和自底向上的注意力路径,生成特征金字塔和注意力金字塔来增强表征;用特征金字塔在自顶向下的路径上提取不同尺度的特征,特征金字塔融合了高层次语义信息丰富的特征图和低层次细节信息丰富的特征图,同时能够定位不同尺度的样本图像,以关注不同尺度对象的细微差异,用cnn做图像分类将最后一层输出的特征图用于后续分类;
14.s22,获得了空间注意力金字塔后,以弱监督方式通过自适应非极大值抑制nms的区域建议方法生成器继续生成感兴趣区域金字塔;
15.s23,对于每层金字塔,在根据区域建议生成器选择感兴趣区域roi,并且构建感兴趣区域金字塔r
all
={rn,r
n+1
,......,r
n+n-1
}后,对低层次特征图bn进行roi引导的细化。
16.进一步地,在步骤s21中,包括子步骤:在特征金字塔上引入额外的注意力层次结构来进一步增强其结构,包括一个用于定位不同尺度的辨别区域的空间注意力金字塔以及一个用于在另一条自底向上的路径中添加通道相关性并将局部信息从较低的金字塔层次传递到较高的金字塔层次的通道注意力路径
17.进一步地,对于空间注意力金字塔而言,每个积木块将相应层次的特征图fk作为输入,并生成空间注意力掩码特征图fk首先经过一个反卷积层,该反卷积层只具有一个输出通道,用以压缩空间信息,再使用sigmoid函数将空间注意力掩码的每个元素归一化为0到1的范围内;在特征金字塔的相应特征层经过全局平均池化层和两层全连接层得到通道注意力。
18.进一步地,包括子步骤:设计分类器时,利用学习到的注意力对特征fk进行加权得到f
′k,以此进行分类,如下公式所示:
[0019][0020]
式中,表示对语义的加法操作。
[0021]
进一步地,在步骤s22中,包括子步骤:使用空间注意力掩码作为锚分数,用弱监督的方式选定区分区域;根据每个金字塔层的卷积感受野,对每层金字塔选取相应的设定好大小和长宽比的建议区域,并在计算分数后在选定的区域上采用自适应非极大值抑制,通过消除重叠的来减少冗余,通过合并相关的来保持视觉完整性。
[0022]
进一步地,在步骤s23中,包括子步骤:包括roi引导的dropblock正则化和roi引导的放大操作,均用于提高细化阶段的精度;
[0023]
所述roi引导的dropblock正则化,从构建的n层感兴趣区域金字塔r
all
={rn,r
n+1
,......,r
n+n-1
}中依据每层的dropblock概率p
all
={pn,p
n+1
,......,p
n+n-1
}随机选择一个roi联合rs;接着等概率地在rs中随机选取信息区域rs,并使其与低层次特征图bn采样率相同,通过将信息区域的激活设置为零来获得掩模m;在低层次特征图bn上应用掩模m并进行归一化,获得需要的特征映射图dn;
[0024]
所述roi引导的放大操作,结合所有金字塔层次的roi区域,以弱监督的方式得到
输入图像的最小包围矩形,然后从dn中提取出该标定区域,并将其放大到与dn相同的大小,来得到用于细化阶段预测的放大特征图。
[0025]
本发明的有益效果包括:
[0026]
本发明提供的基于注意力金字塔卷积神经网络的涡旋光轨道角动量态检测技术方案,有效利用相似多模态叠加涡旋波相似光强图中的细微差异等细节信息,在骨干网络后添加注意力机制的双路径结构,有效提升涡旋光oam检测准确率。
[0027]
本发明引入细粒度图像分类,能结合高层次语义信息和低层次细节信息,有效利用不同涡旋光的光强分布或平面波干涉图之间的细微差异,学习多个层次的图像信息和细化特征。
[0028]
本发明在注意力金字塔的基础上采用一个弱监督自适应区域建议生成器来生成自适应尺寸大小的感兴趣区域,可以自动定位可区分区域,不必手动标注边界框。
[0029]
本发明提出了基于注意力金字塔卷积神经网络的涡旋光轨道角动量态检测技术,在resnet50网络后添加结合了自顶向下的特征路径和自底向上的注意力金字塔的双路径结构,能有效提升涡旋光oam态的检测准确率,提升通信性能。
[0030]
本发明与传统oam自由空间光通信系统相对比,使用基于深度学习的oam模态识别技术实现了端对端的模态识别,仅需要提供oam光强图,不需要例如slm(空间光调制器)等复杂的硬件,既节约了成本又提高速率。
附图说明
[0031]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0032]
图1为本发明实施例中基于注意力金字塔卷积神经网络的涡旋光轨道角动量态检测方法流程图;
[0033]
图2为本发明实施例中对不同oam态,ap-cnn在不同层次定位的感兴趣区域示意图;
[0034]
图3为本发明实施例中用于oam模态识别的注意力金字塔卷积神经网络结构图。
具体实施方式
[0035]
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
[0036]
本发明的发明人在研究背景中问题和找寻相应解决方案的过程中,历经如下过程:
[0037]
首先,本发明的发明人认识到:传统的涡旋光解调技术是基于光学硬件来实现的,例如通过空间光调制器、衍射法,柱透镜法、平面波干涉法、球面波干涉法等,都是涡旋光束进行预处理,来得到肉眼可分辨的光学图案特征。但由于光学硬件昂贵且光学硬件处理能力有限,无法保证通信系统的高性能传输。近年来,基于深度学习的oam态检测技术引起了越来越多学者的关注。
[0038]
最开始,机器学习在oam态检测上的应用最先被研究。2014年,维也纳大学mario krenn团队提出了基于自组织竞争神经网络(self-organizing map,som)的oam态检测技术,首次验证了机器学习应用于涡旋光通信的可行性。2016年,其团队在加那利岛屿之间的海面上搭建长距离传输的涡旋光通信系统,叠加态涡旋光束经过143km的传输,以ccd相机捕获的灯塔漫反射光斑来检测oam态,检测准确率为91.67%,验证了涡旋光束长距离传输信息的可能。
[0039]
随着神经网络的发展,基于不断优化的神经网络结构检测oam态。2016年,knutson团队提出基于深度神经网络(deep neural network,dnn)来检测oam态。2017年,doster团队提出了基于卷积神经网络(convolutional neural network,cnn)的oam态检测技术,基于ccd相机捕获的涡旋光束的光强分布训练网络来检测涡旋光oam态。2017年,北京邮电大学张民团队也使用了cnn作为复用涡旋光束的解调器,并通过实验对比分析了k最近邻神经网络、朴素贝叶斯分类器、bp人工神经网络与卷积神经网络作为oam解调器的性能,发现在不同湍流条件下,cnn的检测性能均高于其他解调器。2017年,美国海军实验室doster团队提出基于深层次alexnet来检测oam态。2018年,国防科技大学赵青松博士为cnn网络添加view-pooling层,使其能够学习不同倾斜角度下捕获的光强分布。2018年,北京邮电大学的田清华团队提出了一种结合turbo信道编码的oam态检测技术,经编码后有效提升了通信传输的可靠性。
[0040]
然后,经过对现有技术的分析,再进行创造性的思考后,发现如下技术问题:
[0041]
1)传统涡旋光通信多采用共轭模态,虽然共轭模态的oam光强图呈花瓣状分布利于分辨,然而有些叠加态涡旋光束的光强图十分相似;且拓扑荷数大的单模态涡旋光束经平面波干涉后的干涉条纹密集,不易检测。图像细节信息没有被有效利用,导致oam态识别准确率降低,从而降低通信性能。
[0042]
2)由于大气湍流的影响,ccd相机捕获的图像发生了扰动畸变,使得本就相似的图像更加难以分辨,模型oam识别准确率有待提升。
[0043]
因此,为了解决上述技术问题,本发明提出了基于注意力金字塔卷积神经网络的轨道角动量(oam)模态识别技术方案,引入细粒度图像分类,结合高层次语义信息和低层次图像细节信息,旨在提升oam检测性能,满足高速、实时、高效通信需求。
[0044]
在具体实施过程中,在结合高层次语义信息和低层次图像细节信息后,有效利用不同涡旋光的光强分布或平面波干涉图之间的细微差异。在resnet50网络后添加结合注意力金字塔的双路径结构,能有效提升涡旋光的检测准确率,且优于其他解调器,有效地优化了通信性能。
[0045]
具体而言,本发明提出了基于注意力金字塔卷积神经网络(本发明自命名名称为:ap-cnn)的涡旋光轨道角动量态检测技术方案。本发明的发明构思包括:
[0046]
(1)引入细粒度图像分类,能结合高层次语义信息和低层次细节信息,有效利用不同涡旋光的光强分布或平面波干涉图之间的细微差异。
[0047]
(2)提出了基于注意力金字塔卷积神经网络的涡旋光轨道角动量态检测技术方案,在resnet50网络后添加结合注意力金字塔的双路径结构,结合了自顶向下的特征路径和自底向上的注意力路径,从而同时学习高层次的整体图像语义和低层次的细节特征语义,用于细粒度分类。能有效提升涡旋光oam态的检测准确率,提升通信性能。
[0048]
如图1所示,给出了基于注意力金字塔卷积神经网络的涡旋光轨道角动量识别技术的步骤流程图,本实施例提供的一种基于注意力金字塔卷积神经网络(ap-cnn)的涡旋光轨道角动量识别方法,基于构建ap-cnn来实现涡旋光oam模态识别方法,包括步骤:
[0049]
步骤1,构建仿真数据集;
[0050]
步骤2,构建深度学习模型;
[0051]
步骤3,深度学习模型训练;
[0052]
步骤4,将测试数据集输入训练好的深度学习模型,识别涡旋光在不同湍流情形下传输后的oam态,获取识别准确率和误码率。
[0053]
在步骤1中,包括如下子步骤:
[0054]
步骤1a):构建涡旋光通信系统,利用相位屏方法仿真大气湍流环境;
[0055]
步骤1b):选择{1,-2}和{1,-2,-5}、{1,-2,-5,3}和{-2,-5,3}、{4,-4}和{-6,2}、{6,-6}和{9,-3}四对oam态,构建一个两两相似的oam叠加态光强图数据集;
[0056]
步骤1c):选择+17,+18,+19,+20,-17,-18,-19,-20这八类拓扑荷数目较大的样本,构建单模态的涡旋光束对应的平面波干涉图数据集。
[0057]
步骤1d):涡旋光通信系统设定的参数如下:波长设定为0.6328μm。中等湍流环境下,大气折射率结构常数从1.0
×
e-14
m-2/3
至5.5
×
e-14
m-2/3
每隔5.0
×
e-15
m-2/3
取一次值共10个值,强湍流环境下,大气折射率结构常数从1.0
×
e-13
m-2/3
至5.5
×
e-13
m-2/3
每隔5
×
e-14
m-2/3
取一次值同样共10个值。传输距离从2000m至4000m每隔200m取一次值共10个值。在不同湍流强度下不同传输距离的每种oam模态仿真生成10张光强图,即每种oam模态仿真生成了1000张光强图像,混合数据集中共包含8000张oam光强图。并以7:3的比例划分为训练集和测试集,训练集共有5600张图片,测试集有2400张图片。对于单模态涡旋光束的模态识别,混合数据集的制作过程与上述叠加态涡旋光束相同。
[0058]
在步骤2中,包括如下子步骤:
[0059]
步骤2a):深度学习模型由resnet50网络和ap-cnn组成;
[0060]
步骤2b):仿真的oam光强图尺寸大小设定为448*448*3;
[0061]
步骤2c):输入进resnet50网络训练,resnet50有stage0、stage1、stage2、stage3以及stage4这5个阶段;
[0062]
步骤2d):首先输入进stage0进行预处理,依次经过卷积层(64个7*7的卷积核,步长为2)提取特征,bn层、relu激活函数以及最大池化层降低分辨率,输出112*112*64的特征图;
[0063]
步骤2e):接着输入到后面的四层残差块,每层均将输入的特征图尺寸降低为原先的1/2,通道数提高一倍;
[0064]
步骤2f):得到预训练网络resnet50作为后续ap-cnn的骨干网络。
[0065]
在步骤3中,包括如下子步骤:
[0066]
步骤3a):选择预训练resnet50的第三、第四和第五层的输出特征图,来建立金字塔层次结构,尺寸依次为28*28*512、14*14*1021、7*7*2048,分别命名为b3,b4,b5;
[0067]
步骤3b):后续在整体图像上分类的进一步细化是在金字塔的b3层次上进行的。在金字塔的每层依次选择尺寸为32*32、64*64、128*128的anchor,在每层都取激活值第一、第三和第五高的anchor作为候选细化区域;
[0068]
步骤3c):自适应非极大值抑制(nms)的分割阈值设定为0.05,合并阈值设定为0.9,dropblock概率设定{30%,30%,0%};
[0069]
步骤3d):ap-cnn训练过程中初始学习率设定为0.001,并使用余弦退火算法逐渐降到0。
[0070]
步骤3f):使用momentum系数为0.9,minibatch为16的随机梯度下降算法进行参数优化,权重衰减设定为5e-4,共训练10个epoch。
[0071]
在步骤4中,包括如下子步骤:
[0072]
将2400张测试数据集输入训练好的ap-cnn深度学习模型,识别涡旋光在不同湍流情形下传输后的oam态,获取识别准确率和误码率。
[0073]
如图2所示,给出了对不同oam态,ap-cnn在不同层次定位的感兴趣区域,图3给出了基于ap-cnn的涡旋光oam识别技术框图。
[0074]
结合图2和图3进一步说明本发明构思如下:注意力金字塔卷积神经网络是一个两级网络,分别以粗略的完整图像和精细的局部特征作为输入。这两个阶段,定义为原始阶段和细化阶段,共享参数和网络结构,分别从完整图像输入和局部特征输入中提取信息,并采用双路径结构和roi(感兴趣区域)引导的特征细化来提高算法的性能。
[0075]
本发明实施例用于oam态检测的细粒度分类算法即注意力金字塔卷积神经网络的原理如图1所示。图中(a)表示双路径算法结构,(b)表示注意力金字塔,(c)表示感兴趣区域金字塔。具体步骤如下:
[0076]
第一步:ap-cnn以完整图像为输入,通过在cnn的基础上改进得到双路径算法结构(如图3中(a)所示,包括自顶向下的特征路径和自底向上的注意力路径),生成了特征金字塔和注意力金字塔来增强表征。用特征金字塔(feature pyramid network,fpn)在自顶向下的路径上提取不同尺度的特征。用cnn做图像分类将最后一层输出的特征图用于后续分类,它包含充足的图像语义信息,细节特征语义信息却不足,细节的像素信息在下采样的过程中很容易丢失,不适用于细粒度图像分类任务。特征金字塔融合了高层次语义信息丰富的特征图和低层次细节信息丰富的特征图,同时可以定位不同尺度的样本图像,以关注不同尺度对象的细微差异。在特征金字塔上引入额外的注意力层次结构来进一步增强其结构,包括一个空间注意力金字塔用于定位不同尺度的辨别区域,和一个通道注意力路径用于在另一条自底向上的路径中添加通道相关性并将局部信息从较低的金字塔层次传递到较高的金字塔层次。
[0077]
对于空间注意力金字塔而言,每个buildingblock(积木块)将相应层次的特征图fk作为输入,并生成空间注意力掩码特征图fk首先经过一个3
×
3的反卷积层,该反卷积层只具有一个输出通道,用以压缩空间信息。使用sigmoid函数将空间注意力掩码的每个元素归一化为0到1的范围内。在特征金字塔的相应特征层经过全局平均池化层和两层全连接层可以得到通道注意力。空间注意力金字塔与通道注意力路径虽然都在自底向上的路径中向上传递低层次的细节信息,但两者的作用并不相同。设计分类器时,利用学习到的注意力对特征fk进行加权得到f
′k,以此进行分类,如公式所示:
[0078][0079]
式中,表示对语义的加法操作。
[0080]
第二步:获得了空间注意力金字塔后,以弱监督方式通过自适应非极大值抑制(non maximum supression,nms)的区域建议生成器继续生成感兴趣区域金字塔。rpn的目的是选取出有可能包含目标的框,本质上是基于滑动窗口的无类别目标检测器,输入任意尺度的图像,得到事先设定好大小和比例的候选框。一般的rpn网络多应用在单尺度卷积网络特征图或者多尺度卷积网络特征图上,预先设定多个大小和长宽比来定位不同大小和不同形状的对象。在rpn的理论基础上,ap-cnn使用空间注意力掩码作为锚分数,用弱监督的方式选定区分区域。ap-cnn根据每个金字塔层的卷积感受野,对每层金字塔选取相应的设定好大小和长宽比的建议区域,并在计算分数后在选定的区域上采用自适应非极大值抑制,通过消除重叠的来减少冗余,通过合并相关的来保持视觉完整性。
[0081]
第三步:对于每层金字塔,在根据区域建议生成器选择roi(,并且构建感兴趣区域金字塔r
all
={rn,r
n+1
,......,r
n+n-1
}后,ap-cnn对低层次特征图bn进行roi引导的细化(包括roi引导的dropblock正则化和roi引导的放大操作),来提高细化阶段的精度。第一部分是roi引导的dropblock正则化,ap-cnn从构建的n层感兴趣区域金字塔r
all
={rn,r
n+1
,......,r
n+n-1
}中依据每层的dropblock概率p
all
={pn,p
n+1
,......,p
n+n-1
}随机选择一个roi联合rs。接着等概率地在rs中随机选取信息区域rs,并使其与低层次特征图bn采样率相同,通过将信息区域的激活设置为零来获得掩模m。在低层次特征图bn上应用掩模m并进行归一化,获得需要的特征映射图dn[0082]
第二部分是roi引导的放大操作,ap-cnn结合所有金字塔层次的roi区域,以弱监督的方式得到输入图像的最小包围矩形,然后从dn中提取出该标定区域,并将其放大到与dn相同的大小,来得到用于细化阶段预测的放大特征图。
[0083]
原始阶段和细化阶段都设置了单独的分类器,最终分类结果取原始阶段预测值和细化阶段预测值的平均值。
[0084]
本发明实施例的效果可通过以下仿真进一步说明:
[0085]
本发明实例混合数据集中共包含8000张oam光强图,并以7:3的比例划分为训练集和测试集,训练集共有5600张图片,测试集有2400张图片。
[0086]
使用检测准确率(accuracy)、系统误比特率(bit error ratio,ber)两种指标来评价本发明实施例所使用的ap-cnn网络的oam态检测性能。
[0087]
检测准确率定义为测试集上,oam态检测正确的样本数量与涡旋光的光强分布图总数的比值,表示如下:
[0088][0089]
式中,m表示涡旋光的光强分布图的总数,m表示oam态,当识别正确时f(m)为1,错误时为0。
[0090]
评价通信系统传输错误的概率一般有误比特率和误符号率(symbol error rate,ser)两种。误符号率定义为码元传输错误的概率,是接收端错误的码元数与传输码元总数的比值:
[0091]
[0092]
式中,m表示码元的种类数,pi表示发射每种码元的概率,值均为1/m,p(si|si)表示对于某种oam态接收端检测正确的条件概率密度,表示为:
[0093][0094]
式中,si代表oam态,h
t
、g、l
path
均为常量,分别代表功率检测阈值、接收端平均增益和路径损失。p(si|si)的值理论上主要由接收端信噪比γ
β
和螺旋谱分布决定。
[0095]
误比特率是信息量传输错误的概率,定义为接收端错误的信息量与传输信息量总数的比值,与误符号率的关系如下:
[0096]
ber=ser/(log
2 m)
ꢀꢀꢀ
(4)
[0097]
在发明中,由于基于仿真数据进行实验,将八种oam叠加态与八进制码元一一对应。在接收端,通过识别光强分布,反演得到码字序列,与理论上的码字序列进行对比,错误的码字位数与码字总数的比值即为误比特率。
[0098]
假设涡旋光通信系统接收端信噪比γb=10db,基于识别准确率可计算得到系统误码率。
[0099]
使用基于resnet50和ap-cnn两种网络的叠加态oam识别技术的通信性能对比如表1所示。由表1中数据可知,在两种湍流环境下,ap-cnn相较于resnet50,系统误码率降低了约40%。使用基于resnet50和ap-cnn两种网络的单一态oam识别技术的通信性能对比如表2所示,使用基于ap-cnn的模态识别技术,系统误码率约为前者的八分之一。证明本发明所述方法可以提高涡旋光在大气湍流传输通信的oam识别准确率,降低通信误码率。
[0100]
表1 叠加态oam编码,使用不同oam模态识别技术的通信性能对比
[0101][0102]
表2 单一模态oam编码,使用不同oam模态识别技术的通信性能对比
[0103]
模态识别网络accuracy(准确率)ber(误比特率)resnet5086.9%9.48
×
10-3
ap-cnn95.4%1.26
×
10-3
[0104]
实施例1
[0105]
一种基于深度学习的轨道角动量模态识别方法,包括:
[0106]
s1,构建仿真数据集;
[0107]
s2,构建深度学习模型:包括构造注意力金字塔卷积神经网络,用于提升涡旋光轨道角动量模态的检测准确率;
[0108]
s3,训练基于构造注意力金字塔卷积神经网络的深度学习模型;
[0109]
s4,将测试数据集输入训练好的深度学习模型,识别涡旋光在不同湍流情形下传输后的轨道角动量模态,获取识别准确率和误码率。
[0110]
实施例2
[0111]
在实施例1的基础上,在步骤s2中,所述注意力金字塔卷积神经网络为在resnet50网络后添加结合注意力金字塔的双路径算法结构,为一个两级网络,分别以粗略的完整图像和精细的局部特征作为输入,在这两个阶段,定义为原始阶段和细化阶段,共享参数和网络结构,分别从完整图像输入和局部特征输入中提取信息,并采用双路径算法结构和感兴趣区域roi引导的特征细化来提高性能;并且,原始阶段和细化阶段都设置了单独的分类器,最终分类结果取原始阶段预测值和细化阶段预测值的平均值。
[0112]
实施例3
[0113]
在实施例1或实施例2的基础上,在步骤s2中,包括子步骤:
[0114]
s21,所述注意力金字塔卷积神经网络以完整图像为输入,包括在cnn网络的基础上改进得到的双路径算法结构;所述双路径算法结构包括自顶向下的特征路径和自底向上的注意力路径,生成特征金字塔和注意力金字塔来增强表征;用特征金字塔在自顶向下的路径上提取不同尺度的特征,特征金字塔融合了高层次语义信息丰富的特征图和低层次细节信息丰富的特征图,同时能够定位不同尺度的样本图像,以关注不同尺度对象的细微差异,用cnn做图像分类将最后一层输出的特征图用于后续分类;
[0115]
s22,获得了空间注意力金字塔后,以弱监督方式通过自适应非极大值抑制nms的区域建议方法生成器继续生成感兴趣区域金字塔;
[0116]
s23,对于每层金字塔,在根据区域建议生成器选择感兴趣区域roi,并且构建感兴趣区域金字塔r
all
={rn,r
n+1
,......,r
n+n-1
}后,对低层次特征图bn进行roi引导的细化。
[0117]
实施例4
[0118]
在实施例3的基础上,在步骤s21中,包括子步骤:在特征金字塔上引入额外的注意力层次结构来进一步增强其结构,包括一个用于定位不同尺度的辨别区域的空间注意力金字塔以及一个用于在另一条自底向上的路径中添加通道相关性并将局部信息从较低的金字塔层次传递到较高的金字塔层次的通道注意力路径
[0119]
实施例5
[0120]
在实施例4的基础上,对于空间注意力金字塔而言,每个积木块将相应层次的特征图fk作为输入,并生成空间注意力掩码特征图fk首先经过一个反卷积层,该反卷积层只具有一个输出通道,用以压缩空间信息,再使用sigmoid函数将空间注意力掩码的每个元素归一化为0到1的范围内;在特征金字塔的相应特征层经过全局平均池化层和两层全连接层得到通道注意力。
[0121]
实施例6
[0122]
在实施例5的基础上,包括子步骤:设计分类器时,利用学习到的注意力对特征fk进行加权得到f
′k,以此进行分类,如下公式所示:
[0123][0124]
式中,表示对语义的加法操作。
[0125]
实施例7
[0126]
在实施例3的基础上,在步骤s22中,包括子步骤:使用空间注意力掩码作为锚分数,用弱监督的方式选定区分区域;根据每个金字塔层的卷积感受野,对每层金字塔选取相应的设定好大小和长宽比的建议区域,并在计算分数后在选定的区域上采用自适应非极大值抑制,通过消除重叠的来减少冗余,通过合并相关的来保持视觉完整性。
[0127]
实施例8
[0128]
在实施例3的基础上,在步骤s23中,包括子步骤:包括roi引导的dropblock正则化和roi引导的放大操作,均用于提高细化阶段的精度;
[0129]
所述roi引导的dropblock正则化,从构建的n层感兴趣区域金字塔r
all
={rn,r
n+1
,......,r
n+n-1
}中依据每层的dropblock概率p
all
={pn,p
n+1
,......,p
n+n-1
}随机选择一个roi联合rs;接着等概率地在rs中随机选取信息区域rs,并使其与低层次特征图bn采样率相同,通过将信息区域的激活设置为零来获得掩模m;在低层次特征图bn上应用掩模m并进行归一化,获得需要的特征映射图dn;
[0130]
所述roi引导的放大操作,结合所有金字塔层次的roi区域,以弱监督的方式得到输入图像的最小包围矩形,然后从dn中提取出该标定区域,并将其放大到与dn相同的大小,来得到用于细化阶段预测的放大特征图。
[0131]
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0132]
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
[0133]
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
[0134]
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

技术特征:
1.一种基于深度学习的轨道角动量模态识别方法,其特征在于,包括以下步骤:s1,构建仿真数据集;s2,构建深度学习模型:包括构造注意力金字塔卷积神经网络,用于提升涡旋光轨道角动量模态的检测准确率;s3,训练基于构造注意力金字塔卷积神经网络的深度学习模型;s4,将测试数据集输入训练好的深度学习模型,识别涡旋光在不同湍流情形下传输后的轨道角动量模态,获取识别准确率和误码率。2.根据权利要求1所述的基于深度学习的轨道角动量模态识别方法,其特征在于,在步骤s2中,所述注意力金字塔卷积神经网络为在resnet50网络后添加结合注意力金字塔的双路径算法结构,为一个两级网络,分别以粗略的完整图像和精细的局部特征作为输入,在这两个阶段,定义为原始阶段和细化阶段,共享参数和网络结构,分别从完整图像输入和局部特征输入中提取信息,并采用双路径算法结构和感兴趣区域roi引导的特征细化来提高性能;并且,原始阶段和细化阶段都设置了单独的分类器,最终分类结果取原始阶段预测值和细化阶段预测值的平均值。3.根据权利要求1或2任一所述的基于深度学习的轨道角动量模态识别方法,其特征在于,在步骤s2中,包括子步骤:s21,所述注意力金字塔卷积神经网络以完整图像为输入,包括在cnn网络的基础上改进得到的双路径算法结构;所述双路径算法结构包括自顶向下的特征路径和自底向上的注意力路径,生成特征金字塔和注意力金字塔来增强表征;用特征金字塔在自顶向下的路径上提取不同尺度的特征,特征金字塔融合了高层次语义信息丰富的特征图和低层次细节信息丰富的特征图,同时能够定位不同尺度的样本图像,以关注不同尺度对象的细微差异,用cnn做图像分类将最后一层输出的特征图用于后续分类;s22,获得了空间注意力金字塔后,以弱监督方式通过自适应非极大值抑制nms的区域建议方法生成器继续生成感兴趣区域金字塔;s23,对于每层金字塔,在根据区域建议生成器选择感兴趣区域roi,并且构建感兴趣区域金字塔r
all
={r
n
,r
n+1
,......,r
n+n-1
}后,对低层次特征图b
n
进行roi引导的细化。4.根据权利要求3所述的基于深度学习的轨道角动量模态识别方法,其特征在于,在步骤s21中,包括子步骤:在特征金字塔上引入额外的注意力层次结构来进一步增强其结构,包括一个用于定位不同尺度的辨别区域的空间注意力金字塔以及一个用于在另一条自底向上的路径中添加通道相关性并将局部信息从较低的金字塔层次传递到较高的金字塔层次的通道注意力路径5.根据权利要求4所述的基于深度学习的轨道角动量模态识别方法,其特征在于,对于空间注意力金字塔而言,每个积木块将相应层次的特征图f
k
作为输入,并生成空间注意力掩码特征图f
k
首先经过一个反卷积层,该反卷积层只具有一个输出通道,用以压缩空间信息,再使用sigmoid函数将空间注意力掩码的每个元素归一化为0到1的范围内;在特征金字塔的相应特征层经过全局平均池化层和两层全连接层得到通道注意力。
6.根据权利要求5所述的基于深度学习的轨道角动量模态识别方法,其特征在于,包括子步骤:设计分类器时,利用学习到的注意力对特征f
k
进行加权得到f'
k
,以此进行分类,如下公式所示:式中,表示对语义的加法操作。7.根据权利要求3所述的基于深度学习的轨道角动量模态识别方法,其特征在于,在步骤s22中,包括子步骤:使用空间注意力掩码作为锚分数,用弱监督的方式选定区分区域;根据每个金字塔层的卷积感受野,对每层金字塔选取相应的设定好大小和长宽比的建议区域,并在计算分数后在选定的区域上采用自适应非极大值抑制,通过消除重叠的来减少冗余,通过合并相关的来保持视觉完整性。8.根据权利要求3所述的基于深度学习的轨道角动量模态识别方法,其特征在于,在步骤s23中,包括子步骤:包括roi引导的dropblock正则化和roi引导的放大操作,均用于提高细化阶段的精度;所述roi引导的dropblock正则化,从构建的n层感兴趣区域金字塔r
all
={r
n
,r
n+1
,......,r
n+n-1
}中依据每层的dropblock概率p
all
={p
n
,p
n+1
,......,p
n+n-1
}随机选择一个roi联合r
s
;接着等概率地在r
s
中随机选取信息区域r
s
,并使其与低层次特征图b
n
采样率相同,通过将信息区域的激活设置为零来获得掩模m;在低层次特征图b
n
上应用掩模m并进行归一化,获得需要的特征映射图d
n
;所述roi引导的放大操作,结合所有金字塔层次的roi区域,以弱监督的方式得到输入图像的最小包围矩形,然后从d
n
中提取出该标定区域,并将其放大到与d
n
相同的大小,来得到用于细化阶段预测的放大特征图。

技术总结
本发明公开了一种基于深度学习的轨道角动量模态识别方法,属于自由空间光通信领域,包括步骤:S1,构建仿真数据集;S2,构建深度学习模型:包括构造注意力金字塔卷积神经网络,用于提升涡旋光轨道角动量模态的检测准确率;S3,训练基于构造注意力金字塔卷积神经网络的深度学习模型;S4,将测试数据集输入训练好的深度学习模型,识别涡旋光在不同湍流情形下传输后的轨道角动量模态,获取识别准确率和误码率。本发明有效利用了相似多模态叠加涡旋波相似光强图中的细微差异等细节信息,在骨干网络后添加注意力机制的双路径结构,有效提升了涡旋光OAM检测准确率。旋光OAM检测准确率。旋光OAM检测准确率。


技术研发人员:屈檀 张延 赵志明 吴家骥 吴振森
受保护的技术使用者:西安电子科技大学
技术研发日:2022.07.26
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-839.html

最新回复(0)