本发明涉及信道估计领域,特别涉及一种基于深度学习的ambc系统信道估计方法。
背景技术:
1、物联网(internet of things,iot)的发展已经有将近30年的历史,其一直都是一个热门话题。目前世界各国都形成了各有特色的政策规划,在工业、农业、医疗等领域积极地推广和应用物联网技术,3gpp(3rd generation partnership project,第三代合作伙伴计划)在release 13中通过了窄带物联网(nb-iot,narrowband internet of things)技术标准,标志着nb-iot将会进入商用阶段。现在的蜂窝网络以及移动互联网已经能够让人与人之间方便快捷地进行交流,但是万物互联这一概念还没有真正实现,物联网还需要更多技术的支持,更多研究的开展。反向散射技术由stockman于1948年提出,之后出现了相应的射频识别(rfid,radio frequency identification)产品和应用。由于rfid技术能够自动识别射频标签且功耗低,其成为了iot中的一项重要技术,rfid的基本原理是利用一个读写器发送专用的射频信号给射频标签,射频标签收到信号后将自身的信息加载到这一信号上,并将信号反射回读写器,读写器收到信号后对信号进行处理,得到射频标签发送的信息。随着iot技术的发展,rfid技术也面临着一些问题,如存在双重的路径损耗,通信距离短;射频标签反射的信号在读写器处会受到读写器射频源信号的自干扰,影响信号的传输性能。为了解决rfid技术出现的问题,一些新型反向散射技术被提出,包括双站反向散射通信(bistatic backscattercommunication,bibc)技术、ambc(ambient backscattercommunication,am bc)技术等。
2、bibc技术中,读写器的发送机和接收机分离开来,不再集成于一个设备上,由发送机产生载波给附近的反射设备(例如传感器,射频标签),反射设备再将自身信息加载在载波上然后反射给接收机,这一技术能够提高反向散射通信系统的传输距离,有更加广泛的应用。
3、和bibc技术相比,ambc技术利用周围环境中的无线信号作为能量源和载波源来发送自身的信息,免除了专用载波发送机的使用,功耗更加少。另外,ambc技术利用的是环境中的无线信号传输信息,不需要额外的频谱,能够缓解频谱资源紧张的现状。
4、然而,ambc技术也存在一些问题。由于反射设备反射的是环境中的无线信号,所以在接收机处反射信号会受到来自环境中的无线信号的强干扰,接收机难以恢复反射设备符号;在许多应用场景中,反射设备的数量都非常庞大,现有的一些多址接入技术,如频分多址(frequency divisionmultiple access,fdma)、时分多址(time division multipleaccess,tdma),难以实现ambc技术中反射设备多址接入的要求;反射设备的电路设计比较简单,不能实现复杂的信号和信息处理,这会导致安全方面的问题。
5、在ambc系统中,反射链路信号平均功率比直接链路信号低几个数量级,可以先将反射链路当干扰解调出射频源符号,接着恢复直接链路信号,从接收信号中减去这一信号。最后对剩余信号进行处理,恢复反射设备符号。想要恢复反射设备符号,必须要先对直接链路进行信道估计,
6、随着车联网(internet of vehicles,iov)的发展,越来越多高速移动场景的出现对无线通信系统提出了越来越高的要求。高速移动和多径传输会给信道带来时间选择性和频率选择性衰落。从受到影响的接收信号中估计出信道状态信息(channel stateinformation,csi)是接收端恢复发送符号的重要步骤之一。传统基于导频的信道估计方法在面对高速变化的信道时,需要在发送符号中插入较多的导频符号,导致系统的传输效率降低。为了降低导频开销,信道预测技术可以被用来对连续变化的信道状态信息csi进行预测,但常用的自回归(autoregressive,ar)线性预测法预测性能有所不足。而近年来,具有强大数据处理能力的深度学习(deep learning,dl)技术给通信系统带来了全新的设计方法。因此通过对现有深度学习在信道估计和预测方面的研究成果的分析,沿着模型驱动的思路利用深度学习技术解决传统信道估计和预测方法中存在的一些问题,对正交频分复用(orthogonal frequency division multiplexing,ofdm)系统在瑞利双选衰落信道下的信道估计和预测方法进行了深入研究。
技术实现思路
1、为了解决现有问题,本发明提供了一种基于深度学习的ambc系统信道估计方法,具体方案如下:
2、一种基于深度学习的ambc系统信道估计方法,包括以下步骤:
3、s1,根据设计要求,通过matlab r2023a仿真平台搭建除神经网络外的ambc通信系统,设定具体的输入,包括子载波数n、信道长度l、导频数p、非零数t实验条件,搭建仿真平台;
4、s2,在发送端,带有导频的频域发送符号首先经过idft调制,然后插入循环前缀和并串变换后发送出去;
5、s3,通过瑞利双选衰落信道后,接收端接收到的时域信号,先经过串并变换和去循环前缀,再经过dft解调得到频域符号;
6、s4,对导频处的信道状态信息csi进行ls估计;将ls估计值、发送和接收导频符号一起送入到k层神经网络,得到优化的csi;
7、s5,引入二维cnn提取信道沿时间和频率两个轴上的相关性信息,对csi进行高分辨率重建;
8、s6,多个lstm单元横向级联组成一层lstm网络,然后两层lstm网络再纵向级联在一起,其中同一层的lstm单元有着相同的参数,最后全连接层用于提取特征并输出结果;每一层lstm中横向的单元个数代表了网络的记忆长度,决定了网络的时间相关性,且每一层的单元个数至少为导频ofdm符号的个数sp;
9、s7,先通过zf均衡使信道预测值向其理论ls估计值靠近,然后再通过k层神经网络处理使信道预测值向其实际值靠近,从而消除一定范围内的误差;当lstm网络对第n个数据ofdm符号的csi的预测过程完成后,对预测值hlstm(n)进行更新。
10、优选地,步骤s3中接收到的时域信号可以表示为y(n)=h(n)*x(n)+w(n);其中,*表示卷积,n是子载波个数,x(n)和h(n)是第n个子载波上传输的时域符号和经过的时域信道响应,w(n)是均值为0,方差为δ2的高斯白噪声;
11、相应的频域接收符号可以表示为y(k)=h(k)x(k)+w(k),其中y(k)、h(k)、x(k)和w(k)分别是y(n)、h(n)、x(n)和w(n)的dft结果;
12、对于双选衰落信道,将导频放置在每一个长为sb的发送符号块的头部,其中导频ofdm符号的个数为sp,纯数据ofdm符号的个数为sd=sb-sp。
13、优选地,步骤s4具体为:当子载波的个数为n时,接收到的一个频域ofdm符号和相应的发送频域ofdm符号先经过ls信道估计器,得到输入到k层神经网络中,经过k层神经网络的优化后得到实部和虚部交替排列的实值csi估计值k取不同数值得到的csi估计值进行比较,在不同的信道状态下,信道估计性能也不同;设置信噪比梯度{5,10,15,20}db信噪比和{583}hz最大多普勒频率条件下,每个条件随机产生10000组训练符号组成训练数据集,并用于训练k层神经网络,其中一个训练样本可以表示为是输入;是标签,表示当前ofdm符号的实部和虚部交替排列的实际csi。
14、优选地,步骤s5具体为:两个结构相同的,且一个用于实部一个用于虚部的cnn被用于信道插值,其输入是两个分别由sp个导频ofdm符号的实部和虚部组成的tf网格,包括由s4中的信道估计网络得到的导频子载波处的csi估计值和其它数据位置处的零值;经过两个cnn卷积处理后,得到两个分别包含所有位置处csi的实部和虚部的完整tf网格hpcnn;两个cnn是经过离线训练后再被部署在ofdm系统中实现插值功能。
15、优选地,步骤s6具体为:假设子载波个数为n,每一层的lstm单元数为d,当前时刻为n,则第一层lstm的输入为前1时刻到前d个时刻的各个包含所有子载波的ofdm符号的csi:第二层lstm的输入为第一层lstm的输出,即第一层lstm的前1个时刻到前d个时刻的各个短时记忆其中l1表示第一层lstm的神经元个数。全连接层的输入为第二层lstm最后一个单元输出的短时记忆其中l 2表示第二层lstm的神经元个数,输出为预测的当前时刻csi值预测过程可简要表示为其中p表示该lstm网络的预测过程;lstm网络是先经过离线训练再被部署在系统中实现预测功能的。
16、优选地,步骤s7对预测值hlstm(n)进行更新包括以下5个步骤:
17、s71,通过zf均衡恢复第n个ofdm发送符号,即
18、s72,对恢复软符号进行硬判决,xzfh(n)=sign(xzfs(n));
19、s73,对硬符号进行ls估计,即
20、s74,通过s3提出的k层神经网络得到优化后的csi:hdnn(n);
21、s75,hlstm(n)的值由hdnn(n)替代。
22、本发明还揭示了一种计算机可读存储介质,介质上存有计算机程序,计算机程序运行后,执行如上述任一项所述的方法。
23、本发明还揭示了一种计算机系统,包括处理器、存储介质,存储介质上存有计算机程序,处理器从存储介质上读取并运行计算机程序以执行如上述任一项所述的方法。
24、本发明的有益效果在于:
25、(1)本发明拥有强大曲线拟合能力的阈值迭代算法展开成k层神经网络被用于对ls估计值进行优化,解决了ls法受到噪声影响和lmmse法需要信道先验信息的问题。拥有强大二维图像处理能力的cnn被用于信道插值,解决了样条插值法边缘模糊和细节不清晰的问题。拥有强大时间序列处理能力的lstm网络被用于对信道进行无导频预测,以及数据判决反馈机制被用于减小误差传播的影响。该信道估计和预测网络结构非常灵活,三种网络可以独立训练,也可以被其它更先进的网络取代以获得更好的性能。仿真结果表明,本发明所提的信道估计和预测网络解决了传统信道估计和预测方法性能较差的问题,并且在高信噪比条件下保证传输质量的同时提高了传输效率。
26、(2)本发明将通信系统的参数和强化学习的元素对应起来,搭建强化学习系统;然后针对状态获取步骤,提出了基于阈值迭代算法展开成k层神经网络的噪声强度估计方法和基于多步长lstm的未来信道状态信息预测方法;最后引入了bdqn算法将动作分成多个维度上简单的子动作,解决了动作数量庞大的难题,并学习如何根据当前系统状态调整导频方案。仿真结果证明了本发明所提的基于阈值迭代算法展开成k层神经网络的噪声强度估计和基于多步长lstm的未来信道状态信息预测方法的有效性,表明了基于bdqn的自适应导频位置与间距调整机制可以侧重于传输质量或者传输效率,也可以是两者的折中,以及基于深度学习的信道估计和预测网络与bdqn的联合ofdm系统可以在保证传输质量的同时提高传输效率。
1.一种基于深度学习的ambc系统信道估计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于:步骤s3中接收到的时域信号可以表示为y(n)=h(n)*x(n)+w(n);其中,*表示卷积,n是子载波个数,x(n)和h(n)是第n个子载波上传输的时域符号和经过的时域信道响应,w(n)是均值为0,方差为δ2的高斯白噪声;
3.根据权利要求1所述的方法,其特征在于,步骤s4具体为:当子载波的个数为n时,接收到的一个频域ofdm符号和相应的发送频域ofdm符号先经过ls信道估计器,得到输入到k层神经网络中,经过k层神经网络的优化后得到实部和虚部交替排列的实值csi估计值k取不同数值得到的csi估计值进行比较,在不同的信道状态下,信道估计性能也不同;设置信噪比梯度{5,10,15,20}db信噪比和{583}hz最大多普勒频率条件下,每个条件随机产生10000组训练符号组成训练数据集,并用于训练k层神经网络,其中一个训练样本可以表示为是输入;是标签,表示当前ofdm符号的实部和虚部交替排列的实际csi。
4.根据权利要求1所述的方法,其特征在于,步骤s5具体为:两个结构相同的,且一个用于实部一个用于虚部的cnn被用于信道插值,其输入是两个分别由sp个导频ofdm符号的实部和虚部组成的tf网格,包括由s4中的信道估计网络得到的导频子载波处的csi估计值和其它数据位置处的零值;经过两个cnn卷积处理后,得到两个分别包含所有位置处csi的实部和虚部的完整tf网格hpcnn;两个cnn是经过离线训练后再被部署在ofdm系统中实现插值功能。
5.根据权利要求1所述的方法,其特征在于,步骤s6具体为:假设子载波个数为n,每一层的lstm单元数为d,当前时刻为n,则第一层lstm的输入为前1时刻到前d个时刻的各个包含所有子载波的ofdm符号的csi:i=1,2,…,d,第二层lstm的输入为第一层lstm的输出,即第一层lstm的前1个时刻到前d个时刻的各个短时记忆i=1,2,…,d其中l1表示第一层lstm的神经元个数。全连接层的输入为第二层lstm最后一个单元输出的短时记忆其中l2表示第二层lstm的神经元个数,输出为预测的当前时刻csi值预测过程可简要表示为其中p表示该lstm网络的预测过程;lstm网络是先经过离线训练再被部署在系统中实现预测功能的。
6.根据权利要求1所述的方法,其特征在于,步骤s7对预测值hlstm(n)进行更新包括以下5个步骤:
7.一种计算机可读存储介质,其特征在于:介质上存有计算机程序,计算机程序运行后,执行如权利要求1至6中任一项所述的方法。
8.一种计算机系统,其特征在于:包括处理器、存储介质,存储介质上存有计算机程序,处理器从存储介质上读取并运行计算机程序以执行如权利要求1至6中任一项所述的方法。
