1.本发明涉及信息通信领域,具体是设计采用收集能量供电的通信系统的发送功率、调制方式和编码码率在线联合控制方法。
背景技术:2.能量收集(energy harvesting,eh)技术能够将不同类型的绿色能量转化为电能,在通信系统中采用eh技术有利于环境的保护和节点的部署。由于环境中的能量源不可控,能量收集具有随机波动性,因而对于依靠收集的能量运转的通信系统而言,能量的使用策略是一个影响系统性能和服务质量的重要因素,如何根据无线信道的衰落和收集能量的情况,对发送功率和传输速率进行动态的控制,实现对能量和信道的高效利用是一个重要课题。
3.eh通信系统中的功率控制算法包括离线功率控制和在线功率控制两类。在信息传输开始前知道信道衰落等信息就采用离线功率控制算法分配发送功率,离线注水算法是常见的离线功率控制算法。实际上,能量到达和信道衰落是随机变化的,不依赖于未来系统状态信息的在线功率控制算法才更加实用。在线算法根据能量到达、信道衰落等的统计信息,以及当前和过去的系统状态做出决策。将功率控制过程建模为马尔科夫决策过程(markov decision process,mdp),并采用动态规划进行求解是常用的在线功率控制算法。mdp加动态规划的方法依赖于状态转移概率等统计信息,在系统状态空间较大时求解复杂度很高。
4.lyapunov优化技术只需要根据系统当前和过去的状态做出决策,从而优化长期平均性能。具体是将优化目标作为惩罚项,将队列长度漂移与惩罚项的和作为目标函数,通过最小化该目标函数能满足长期时间平均下队列的稳定和达到性能目标的优化,通过构造稳定的虚队列能满足优化问题中的约束条件,从而可以降低优化问题求解的复杂度。近年来,有不少文献研究了利用lyapunov优化框架来求解eh通信系统中功率控制的优化问题。文献[amimavaei f,dong m.online power control optimization for wireless transmission with energy harvesting and storage[j].ieee transactions on wireless communications,2016,15(7):4888-4901.]和文献[dong m,li w,amirnavaei f.online joint power control for two-hop wireless relay networks with energy harvesting[j].ieee transactions on signal processing,2018,66(2):463-478.]针对发送端、中继节点由eh装置供电的点对点通信系统和中继传输系统中的平均速率最大化问题,利用lyapunov优化框架将约束改为虚队列要求,将长期平均优化问题转化为仅依赖于当前电池状态和信道状态的单时隙在线优化问题。文献[lei weijia,li qin.online power control based on lyapunov optimization framework for decode-and-forward relay systems with energy harvesting[j].ieee access,2019,7:71335-71349.]考虑两跳解码转发中继系统,针对发送端平均能耗最小化和中继传输速率最大化为目标的发送端和中继节点发送功率的联合优化问题,利用lyapunov优化框架将优化问题转换为虚队列
稳定条件下的两个子问题,并求解。
[0005]
研究eh系统中功率控制的文献,多以优化系统理论上的最大传输速率或吞吐量为目标。为适应信道衰落和能量收集量的随机时变,需要采用自适应编码调制技术,根据信道状态调整信道编码的码率和调制阶数,以提高传输速率。近年来,有少量文献研究了eh通信系统中的发送功率和调制方式的控制问题。文献[mar,zhang w.adaptive mqam for energy harvesting wireless communications with 1-bit channel feedback[j].ieee transactions on wireless communications,2015,14(11):6459-6470.]针对点对点eh无线通信系统,提出了一种基于接收端反馈的1比特信道状态信息的后向迭代算法获得最优调制方式与发送功率组合,最大化吞吐量。文献[li mingyu,zhao xiaohui,liang h,et al.deep reinforcement learning optimal transmission policy for communication systems with energy harvesting and adaptive mqam[j].ieee transactions on vehicular technology,2019,68(6):5782-5793.]针对点对点eh无线通信系统,将系统误码性能约束下的发送功率和调制阶数的控制过程建模为一个状态转移概率未知的mdp,并使用深度q网络算法在连续状态空间中求解。文献[qiu chengrun,hu yang,chen yan,et al.lyapunov optimization for energy harvesting wireless sensor communications[j].ieee internet of things journal,2018,5(3):1947-1956.]研究eh无线通信系统中传输速率最大化问题,在误比特率约束和有限种调制方式下,提出一种基于电池电量和信道状态的发送功率和调制方式的联合优化策略。文献[雷维嘉,孙嘉琳,谢显中,等.能量收集通信系统中功率和调制方式的在线联合优化策略[j].电子与信息学报,2022,44(03):1024-1033.]考虑点对点eh无线通信系统,以最大化系统长期平均实际可实现传输速率为目标构造发送功率、调制方式和帧长的联合优化问题,然后利用lyapunov优化框架对优化问题进行转换,并给出了问题的解。
技术实现要素:[0006]
本发明研究点对点能量收集无线通信系统中,以最大化系统长期平均吞吐量为目标的功率和传输速率的调度优化问题。发送端配备有能量收集装置和可充电电池,每时隙发送信号的能量来自于从周围环境中收集的能量。在电池容量受限条件下,利用lyapunov框架求解发送功率、调制方式、编码信息位长度的联合优化问题,最大化长期时间平均吞吐量。
[0007]
为了实现上述目的本发明构造以最大化系统传输速率为目标的优化问题,将优化问题转化为长期时间平均值的优化问题后,利用lyapunov框架解决,构建出“漂移加惩罚”项,将最小化“漂移加惩罚”项转化为最小化此项的上界达到优化目的,求解包含发送功率、调制方式、信息位长度的三参数优化问题,得到最优解。
[0008]
本发明采用的具体技术方案是,能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,发送端发送信号的能量来自于能量收集设备,在能量到达过程随机、信道为时变衰落信道,且电池容量受限条件下,仅依赖于当前的电池状态和信道状态,联合控制发送端发送功率、调制方式及信息位长度,最大化长期时间平均传输速率;具体包括以下步骤:
[0009]
(1)对通信系统进行建模,每时隙发送端从周围环境中收集能量用于向接收端发
送信息,以最大发送功率限制、电池存储电量对发送功率的限制和电池电量变化为约束条件,以最大化长期时间平均传输速率为目标,构造优化问题;
[0010]
(2)利用lyapunov优化框架,发送端的电池电量加偏移后得到虚队列,再将传输速率的负值作为惩罚项,构建“漂移加惩罚”项,将受约束的最大化长期平均传输速率的优化问题转化为最小化“漂移加惩罚”项;
[0011]
(3)将最小化“漂移加惩罚”项转化为最小化“漂移加惩罚”项的上界;
[0012]
(4)根据能量到达及信道状态做出决策,寻找发送功率、调制方式、信息位长度最优组合,即求解优化目标函数的最优解。
[0013]
具体地,步骤(2)所述利用lyapunov优化框架来解决优化问题,即从队列的稳定性出发,将发送端的电池电量加一个偏移量后作为能量虚队列,保持队列稳定以满足约束条件,将优化目标长期平均传输速率作为惩罚项,构建并最小化“漂移加惩罚”项达到优化目的
[0014]
具体地,步骤(3)所述通过最小化“漂移加惩罚”的上界间接实现满足约束条件,由lyapunov函数和lyapunov漂移式,得到“漂移加惩罚”项的上界表达式;
[0015]
具体地,步骤(4)所述应根据能量到达及信道状态对发送功率、调制方式、信息位长度进行适当的调整。由于不能直接联合优化这3个变量,但调制阶数m和信息位长度k为数量有限的离散取值,可以通过遍历所有可能的调制阶数和信息位长度的组合,优化每个组合下的发送功率p
t
(t),选择使目标函数最大的m、k以及对应的p
t
(t)为最优解。当x(t)≥0时,目标函数是信号发送功率p
t
(t)的单调增函数。此时,为使目标函数最大化,信号发送功率p
t
(t)应取在电池放电功率和存储能量支持下的最大值当x(t)<0时,将发送功率范围p
t,min
,p
t,max
](p
t,min
为发[送功率的最小值,后面介绍如何确定)等分为数个大小为δ1的小区间,判断每一个小区间中是否包含极大值点,若该区间内包含极大值点,再采用黄金分割法找到该极大值点。在获得所有可用信道编码、调制方式组合下的最优发送功率后,比较它们的目标函数值f(p
t
(t),m,k),选择使目标函数最大的调制阶数和信息位长度组合,以及对应的发送功率为优化问题的解。
[0016]
本发明针对能量收集无线通信系统中,以系统实际可达的信息传输速率最大化问题,研究发送功率、调制方式、信道编码参数的联合优化策略。系统的发送端配备有能量收集装置和容量有限的可充电电池,每时隙发送信号的能量来自于从周围环境中收集的能量。首先构造可用能量和电池使用约束下的长期优化问题,然后利用lyapunov优化框架对优化问题进行转换,再给出求解方法。与现有相关文献不同,本发明的优化目标不是理论上传输速率的极限,即信道容量,而是实际系统可实现的传输速率,对发送功率、调制方式、信道编码参数进行联合优化。仿真的结果表明,本发明提出的算法实际可达的信息传输速率要高于以理论极限传输速率为优化目标的算法。
附图说明
[0017]
图1为本发明的通信系统模型;
[0018]
图2为本发明提出最优发送功率搜索算法;
[0019]
图3为本发明提出的算法在不同权重、偏移量下的信息传输速率;
[0020]
图4为本发明提出的算法在不同权重、偏移量下的信息传输速率变化情况;
[0021]
图5为本发明提出的算法与对比算法平均信息传输速率随时间变化的轨迹图;
[0022]
图6为本发明提出的算法与对比算法发送端电池电量随时间变化的轨迹图;
[0023]
图7给出了能量到达率λ对信息传输速率的影响;
[0024]
图8给出了风力发电模型下扇叶半径r对信息传输速率的影响;
[0025]
图9给出了到达能量服从伯努利分布时能量收集概率p对信息传输速率的影响。
具体实施方式
[0026]
本发明的系统模型如图1所示。发送端配备能量收集设备和容量有限的可充电电池,能量收集设备从周围环境中收集能量并转换为电能后存储在电池中,为发送端提供能量。信源产生的信息经过信道编码、调制后,生成符号周期为ts的符号送入信道传输。记时隙的长度为t
ts
,t
ts
>>ts。发送端根据瞬时的信道状态以及能量收集情况,动态地调整发送功率、调制方式以及编码参数,最大化长期时间平均信息传输速率。
[0027]
信源生成的信息序列以k比特为一组,经二进制信道编码后得到n比特的码字,编码后的码元再经过调制后得到发送符号。设信道带宽为b hz,符号速率rs=b baud。假设调制阶数为m,则信息的发送速率为
[0028][0029]
记x(t)为发送端调制后得到的单位功率信号。假设信道为平坦衰落信道,信道系数为h(t),在一个时隙内保持不变。发送信号经过信道传输,接收端接收到的信号为
[0030][0031]
其中,p
t
(t)为信号发送功率,n(t)为均值为0、功率谱密度为n0/2的加性高斯白噪声。
[0032]
假设可选用的调制方式的集合为ω={bpsk,qpsk,16qam,64qam,256qam}。采用以上调制时,接收端解调后的误比特率(bit error rate,ber)为
[0033][0034]
式中n0为加性高斯白噪声的单边功率谱密度,为高斯q函数,e
bav
为接收信号的平均比特能量,表示为
[0035][0036]
ts为符号周期,h(t)为信道系数。解调后的二进制码元序列以码字为单位送入信道编码的译码器进行译码。对于纠错能力为r的分组码,当一个码字中出现的错误不超过r时可以被纠正,译码器正确译码的概率为
[0037][0038]
为组合数的计算,n为编码码长。
[0039]
译码错误的码字将被丢弃。本发明以单位带宽上正确传输信息的速率作为衡量系统性能的指标,其表达式为
[0040][0041]
k表示信息位长度,m表示调制阶数,r为纠错能力,r
bt
为发送端每时隙传输的信息比特数,p
eb
为误比特率。
[0042]
发送端的功耗p(t)除了发送信号的功耗p
t
(t)外,还包括电路的功耗p
cc
(t)。电路功耗又可分为编码电路功耗pc(t)、调制电路功耗pm(t)及其他电路功耗pa等几部分,即
[0043]
p(t)=pc(t)+pm(t)+pa+p
t
(t)=p
cc
(t)+p
t
(t)
[0044]
信道编码器的功耗与信息速率有关,可以表示为
[0045]
pc(t)=σ1·rbt
[0046]
其中,σ1为一个常系数,与具体采用的编码方式、编码电路、电路参数等有关。调制器的功耗与每秒钟调制的二进制码元数量成正比,可表示为
[0047]
pm(t)=σ2·
blog2m
[0048]
其中,σ2为一个常系数,具体数值与电路或信号处理器件有关。
[0049]
发送端在t时隙消耗的总功率p(t)受到电池存储电量eb(t)和最大放电功率p
d,max
的限制:
[0050][0051]
设电池最大容量为eb,可充电电池的最大充电功率为p
c,max
。记时隙t收集的电能为ea(t),时隙t存储进电池的能量eh(t)可以表示为
[0052]
0≤eh(t)≤min(ea(t),t
ts
·
p
c,max
,e
b-(eb(t)-t
ts
·
p(t)))
[0053]
其中,最小值函数最后一项为电池剩余存储容量。经过一个时隙的充电和放电后,电池中的电量更新为
[0054]
eb(t+1)=eb(t)-t
ts
·
p(t)+eh(t)
[0055]eh
(t)表示时隙t到达电池的能量。
[0056]
可知p
eb
与发送功率p
t
、调制阶数m有关,信道编码的纠错能力r与码率有关。为避免编码后码字长度发生变化,一般在通信系统中通过改变码字中信息长度k来调整编码的码
率。显然发送功率越大,当前时隙的信息传输速率越高,但发送端的可用能量是受限的,需要在可用能量的约束下,根据信道状态合理地在时隙间分配和使用能量。m、k越大,发送端发送的信息速率越高,但是错误概率也越高,而m、k还要影响编码和调制电路的功耗,因此也需要结合发送功率、信道状态选择适当的m、k,使得实际的信息传输速率最大化。综合以上分析,本发明的优化问题就是在收集能量的约束下,对每个时隙的发送功率、调制阶数m和信息位长度k进行联合优化,最大化系统的长期平均信息传输速率:
[0057][0058][0059]
eb(t+1)=eb(t)-t
ts
·
p(t)+eh(t)
[0060]
m∈ω
[0061]
k∈k
[0062]
其中,e[
·
]表示期望运算,k为一个码字中可选信息位长度的集合,与选用的信道编码有关,t表示仿真的总时长。
[0063]
将约束条件eb(t+1)=eb(t)-t
ts
·
p(t)+eh(t)改写为
[0064]
eb(t+1)-eb(t)=eh(t)-t
ts
·
p(t)
[0065]
时隙t从0到t-1有
[0066][0067]
对上式两端进行叠加,并求期望可得
[0068][0069]
上式左右两端同时除以t,并求t
→
∞的极限,得到
[0070][0071]
其中,分别表示每个时隙平均收集的能量和发送端的平均功耗。上式的含义是指从长期来看,系统收集到的能量应全部消耗掉,以保持能量收集与使用间的平衡。将优化问题中的单时隙电池电量约束放松为长期时间电量约束,优化问题转换为
[0072][0073]
[0074][0075]
m∈ω
[0076]
k∈k
[0077]
δ(x(t))表示lyapunov漂移,x(t)表示电池能量虚队列,v表示漂移和惩罚项之间的权重,rb(t)表示单位带宽上正确传输信息的速率。
[0078]
优化问题的目标函数和约束条件涉及长期平均,需要在拥有未来的能量收集和信道衰落的变化情况或者它们的统计信息条件下,进行整个传输过程的联合优化,求解的复杂度较高。本发明采用lyapunov优化框架将长期平均约束转化为保持虚队列稳定,并将长期平均优化通过单时隙优化来逼近该随机优化问题。首先构造发送端的电池能量虚队列:
[0079]
x(t)=eb(t)-a
[0080]
式中a为偏移量,用于控制电池的电量水平。根据电池电量更新公式eb(t+1)=eb(t)-t
ts
·
p(t)+eh(t)易得能量虚队列的更新公式为
[0081]
x(t+1)=x(t)-t
ts
·
p(t)+eh(t)
[0082]
定义二次lyapunov函数:
[0083][0084]
lyapunov漂移定义为
[0085][0086]
漂移越小,表示两时隙间队列长度的变化越小,电池电量越接近于a,电池电量越稳定。若能保持能量虚队列稳定,即电池的电量在一个有限的范围内波动,则从长期来看收集的能量与消耗的能量就是相等的。将待最大化的信息传输速率rb的负值作为惩罚项,与lyapunov漂移一起构造“漂移加惩罚”:
[0087]
δ(x(t))-ve[rb(t)|x(t)]
[0088]
式中v是漂移和惩罚项之间的权重。若能使“漂移加惩罚”最小化,则就在保持虚队列(即电池电量)稳定的同时,即满足eb(t+1)=eb(t)-t
ts
·
p(t)+eh(t)的条件下,最大化信息的传输速率。“漂移加惩罚”中的权重v的作用就是权衡队列的稳定性和传输速率的最大化。“漂移加惩罚”存在一个上界,将优化改为最小化上界可进一步降低优化问题求解的复杂度,可得
[0089][0090]
式中(eb(t)-t
ts
·
p(t))2为非负有限值,因此一定存在非负常数c满足
[0091][0092]
于是有
[0093]
δx(t)≤c+x(t)e[eh(t)-t
ts
·
p(t)|x(t)]
[0094]
用上式代替漂移,可得“漂移加惩罚”的上界为
[0095]
δx(t)-ve[rb(t)|x(t)]≤c+x(t)e[eh(t)-t
ts
·
p(t)|x(t)]-ve[rb(t)|x(t)]
[0096]
优化问题可以用去除了约束eb(t+1)=eb(t)-t
ts
·
p(t)+eh(t)的“漂移加惩罚”上界的最小化来逼近。进一步去掉上界中的均值运算,并代入速率的表达式,优化问题可以转化为单时隙的优化问题:
[0097][0098][0099]
m∈ω
[0100]
k∈k
[0101]
上式在优化目标函数上增加了一个负号,将最小化改为了最大化,而约束条件已通过虚队列稳定来满足,故不再出现在优化问题中。
[0102]
记优化问题中的优化目标函数为f(p
t
(t),m,k),展开其中总功率p(t)的表达式,得到
[0103][0104]
目标函数中包含三个优化变量,其中调制阶数m和信息位长度k为数量有限的离散取值,可以通过遍历所有可能的调制阶数和信息位长度的组合,优化每个组合下的发送功率p
t
(t),选择使目标函数最大的m、k以及对应的p
t
(t)为最优解。下面先讨论给定m、k下最优p
t
(t)的求解。
[0105]
当前时隙的传输速率随p
t
(t)增大而增大,因此目标函数中第2项的值也增大。易知当x(t)≥0时,目标函数是信号发送功率p
t
(t)的单调增函数。此时,为使目标函数最大化,信号发送功率p
t
(t)应取在电池放电功率和存储能量支持下的最大值:
[0106][0107]
从实际物理意义上看,x(t)≥0表示电池中有足够的电量支持信息传输。当x(t)<0时,目标函数中的第1项随p
t
(t)的增大而减小,而第2项随p
t
(t)的增大而增大,因此不能直接判断优化目标函数的单调性,需要进一步分析。
[0108]
求目标函数对发送功率p
t
(t)的偏导,得到
[0109][0110]
若时,目标函数单调递减,发送功率应取为0;否则需要找到
[0,p
t,max
(t)]范围内目标函数的极大值点,即满足的解。观察偏导的表达式和ber的表达式,易知该方程是一个包含积分和指数函数的、关于p
t
(t)的高次非线性方程,无法获得该方程的解析解,因此本发明采用数值方法进行求解。由于极值点可能不止一个,因此先将发送功率范围p
t,min
,p
t,max
](p
t,min
为发送功率的最小值,后面介绍如何确定)等分为数个大小为δ1的小区间,判断每一个小区间中是否包含极大值点,若该区间内包含极大值点,再采用黄金分割法找到该极大值点。对于第i个小区间,若是在该区间内存在极大值点,则目标函数在pi的右邻域是递增的,而在pi+δ1的左邻域是递减的。因此,如果f(pi)<f(pi+δ2)且f(pi+δ
1-δ2)>f(pi+δ1),则该区间存在一个极大值点,这里δ2<δ1为一个很小的常数。在找到所有的极值点后,比较各极值点和边界点p
t,min
、p
t,max
处的目标函数值,选择使目标函数最大的点为最优功率点。搜索的流程见图2。
[0111]
任何一种信道编码都有这样一个特性,当进入译码器的序列错误概率超过某个阈值时,译码错误概率会很高,而只有在输入序列错误概率低于该阈值时,编码的纠错能力才能发挥出来,且输出序列的错误概率会随输入错误概率的下降而快速下降。根据译码器的输入错误概率门限ber p
eb,max
的限制,相应的对调制方式有一个最小接收信号功率要求,对应当前信道状态下的最小发送功率p
t,min
。若当前信道条件和调制方式下的p
t,min
>p
t,max
,则表示采用该调制方式的ber超过了信道编码要求的门限,不能使用。
[0112]
在获得所有可用信道编码、调制方式组合下的最优发送功率后,比较它们的目标函数值f(p
t
(t),m,k),选择使目标函数最大的调制阶数和信息位长度组合,以及对应的发送功率为优化问题的解。
[0113]
将自适应优化求解算法总结如算法2所示:
[0114]
[0115][0116]
在优化问题中有两个参数,分别为“漂移加惩罚”中的权重v和电池电量虚队列中的偏移量a。权重反映系统对优化目标的重视程度,权重值越大,则系统倾向于消耗更多的电量使得当前时隙获得更大的传输速率,但同时会增大电量波动性,并降低电池的平均电量;权重值越小,虽然单时隙的传输速率优化强度降低,但电池的平均电量升高,在时隙间有更大的能量调度空间。偏移量用于控制电池的电量水平,偏移量越大,相同的电池电量下虚队列的值越小,优化中会更偏向于选择更小的发送功率,电池的平均电量越高;偏移量越小,电池的平均电量越低,优化中会更偏向于选择更大的发送功率。这两个参数过大或过小都会对系统的长期性能产生不利的影响,其最优取值与信道和能量的随机特性等有关。但即使是在已知信道衰落和能量到达的统计分布信息的情况下,也很难通过数学分析的方法得到这两个参数的最优值,而在统计分布未知的情况下,更是无法事先确定。lyapunov方法的特点之一就是不依赖于系统的统计信息和未来的状态信息自适应地对系统进行控制,因此这两个参数也应能自适应地进行调整。
[0117]
权重v和虚队列偏移量a都对电池电量波动和平均电量水平有直接的影响,所以可根据过去一段时间的电池的电量状态对其进行适当调整。在不知道先验信息的前提下,聚类可将数据分为不同的类,使得同类中的元素尽可能相似,不同类中的元素差别尽可能大。k-means算法简单且时间复杂度与数据集成线性关系,在数据集较小时算法的执行效率比较高。本发明利用基于滑动窗口的k-means聚类方法将一段时间内的电池电量点分为不同的簇,利用簇内和簇间电量的关系反映电池电量的波动和平均特征。记滑动窗口的大小为l,当前时刻的窗口为过去的l个时隙。自适应调整算法整体思路如下:对当前滑动窗口的电
池电量进行k-means聚类,对聚类后的均值电量和加权均值电量进行分析,进而确定电池电量是否稳定。每隔d个时隙更新一次权重和偏移量的值,以是否处在允许的波动范围内为依据判断电量是否稳定,若不稳定,则对权重进行调整;以是否超出上下阈值为依据进行偏移量的调整。
[0118]
将时间和电量作为二维欧氏空间中的坐标,时间和该时间的电池电量确定一个欧氏空间中的点,计算各点之间的欧式距离,根据欧式距离将滑动窗口内的点分为m个簇,聚类簇中心的电量表示为e
c,i
,i=1,...,m,i越大,聚类簇中心越靠近当前时隙。滑动窗口内的均值电量与加权均值电量分别为
[0119][0120][0121]
其中wi为第i簇的权重,满足时间上距离当前时隙越近的簇中心的权重越大,即w1<w2<
…
<wi。将加权均值电量与均值电量的比值作为时隙t的滑动窗口内的电量升降趋势比:
[0122][0123]
电量升降趋势比表示一个滑动窗口内的电量变化趋势,可用来衡量电池电量的稳定性。q1(t)》1表示当前滑动窗口内电量有增加的趋势,q1(t)《1则表示有减少的趋势。设定一个范围[γ
min
,γ
max
],若q1(t)处于该范围内,则可以认为电量是稳定的,否则认为电量波动过大,应该对权重进行调整。若q1(t)>γ
max
,表明随着时间的增加,电池电量增加迅速,故应适当增大权重,从而增大发送功率。若q1(t)<γ
min
,表明随着时间的增加,电池电量减少过快,应适当减小权重。权重调整的步长与滑动窗口内的加权均值电量和均值电量的差值大小成正比,该差值反映了当前滑动窗口下电量增长或降低的程度。权重调整的公式为
[0124][0125]
其中,b1为一个常数,v(t-d)为上一个参数调整时刻权重的值。
[0126]
偏移量a直接影响电池的均值电量。定义滑动窗口中的相对均值电量为均值电量与电池容量的比值:
[0127][0128]
为滑动窗口内的均值电量,eb为电池容量,当它处于上下阈值η
max
和η
min
之间时,即η
min
≤q2(t)≤η
max
,表明电池电量维持在合适的范围内,偏移量不需要调整,否则需要
对偏移量进行调整。调整的公式为
[0129][0130]
其中,b2为固定的常数。
[0131]
下面将结合附图,对本发明做进一步的详细描述。除非特别指明,仿真中的参数设置如下:信道系数h(t)服从均值为0、方差为2
×
10-9
的复高斯分布,即信道衰减为87db;发送端能量到达过程服从复合均匀分布的泊松过程,到达率为λ=0.5单位/时隙,每个单位能量服从[0,0.2]j之间的均匀分布;电池容量eb=50j,电池初始电量为15j,最大放电和充电功率分别为p
c,max
=0.6w和p
d,max
=1.2w;时隙长度t
ts
=1s,仿真时长t=1
×
105s;信道编码译码器限制的最大ber为p
eb,max
=2.5
×
10-2
;噪声功率谱密度n0=1
×
10-17
w/hz;带宽b=1
×
106hz,符号速率rs=1
×
106baud。算法1中的参数调整中的滑动窗口长度l=100s,聚类数量m=4,聚类后中心电量点的权重wi,i=1,...,m集合为{0.1,0.2,0.3,0.4},权重和偏移量的调整间隔d=10s,调整阈值为γ
min
=0.6,γ
max
=1.4,η
max
=0.8,η
min
=0.1;b1和b2分别为0.025和0.01。如无特殊说明,电池电量虚队列的偏移量a的初始值为42,惩罚权重v的初始值为2.5。
[0132]
选用(n,k,r)bch码作为信道编码,码长为n=255,信息位长度k的取值集合为k={247,239,231,223,215,207,199,191,187,179,171,163,155,147,139,131}。编码电路采用反馈移位寄存器电路,包括k个移位寄存器和平均约k/2个异或器(加法器)。假设采用cmos电路,忽略电路的静态功耗,一个移位寄存器或一个异或器在每个时钟周期的能耗为
[0133]eco
=α
·cl
·vdd2
[0134]
其中,α=1为活动因子,c
l
=1.5
×
10-11
f=15pf为负载电容,v
dd
=1.0v为工作电压。编码电路在一个时钟周期完成一次移位运算,时钟频率等于编码器输出码元的速率rs=b
·
log2m,因此编码器的功耗为
[0135][0136]
t
ts
为单位时隙,调制采用数字信号处理器来完成,以ti的c55x系列处理器为例,它的工作功率低至0.15mw/mhz。采用m阶调制方式时,每调制得到一个符号需要进行log2m次运算,每秒钟需要进行blog2m次运算。假设每两个时钟完成一次运算,则调制部分的功耗为
[0137]
pm(t)=3
×
10-10
·
blog2m
[0138]
b为信道带宽,m为调制阶数,其它电路功耗设定为pa=0.011w。
[0139]
先对权重v和偏移量a自适应调整算法的有效性进行验证。首先通过计算机用二维搜索的方法找到设定的仿真条件下,能获得最高长期平均信息传输速率的权重和偏移量的最优值。将lyapunov优化算法中的权重和偏移量固定为该最优值,仿真得到长期平均速率作为权重和偏移量自适应调整性能评估的基准。图3给出了5000个时隙下的平均信息传输速率随偏移量和权重变化的三维图。可以看到在权重v=2.5、偏移量a=42时,系统的平均
信息传输速率最高。
[0140]
图4给出了将权重v和偏移量a设为不同初始值并自适应调整时,从仿真开始到当前时隙的平均信息传输速率随时间变化的轨迹,这两个参数分别固定设为最优的2.5、42的平均速率作为基准。可以看到,权重和偏移量自适应调整的算法中,初始取值不同时,仿真初段的传输速率值会有所不同,但随着仿真的进行,不同初始值下的平均信息传输速率会逐渐趋于一致,稍低于权重和偏移量固定为最优值的平均传输速率。这是因为权重和偏移量的自适应调整过程是一个逐步收敛的过程,仿真开始时由于参数偏离最优值较多,会有性能的损失。随着仿真的进行,参数逐渐收敛到最优值,性能也逐步提高并逼近最优。仿真结果表明本发明给出的参数自适应调整算法是有效的。
[0141]
为验证本发明算法的性能,将其与离线注水算法、半功率算法以及固定比例算法进行性能比较。几种对比算法的具体说明如下。(1)离线注水算法:发送端在传输前已经获得整个传输过程中信道的变化情况和能量收集的情况,根据传输过程中收集到的总能量得到系统的总功耗,不考虑电量使用的因果性和电池电量的溢出。然后在这个总功耗的约束下,采用交替迭代的注水算法得到平均信道容量最大化的最优发送功率,以及该发送功率下最优的调制阶数、信息位长度组合。(2)半功率算法(half power algorithm,hpa):每个时隙消耗的总能量为电池中现有电量的一半,即
[0142][0143]
(3)固定比例算法(fixed fraction policies,ffp):每时隙消耗的总能量为电池可用能量的固定比例部分,该比例为长期平均到达能量的倍数与电池容量的比值,具体倍数值的设定与电池电量的溢出有关,表示为
[0144][0145]
仿真半功率算法、固定比例算法的平均信息传输速率时,先根据算法得到总功率,然后计算各调制阶数m、信息位长度k组合下的电路功耗以及对应的发送功率,再计算各自的信息传输速率rb(t),选择其中的最大值作为该算法达到的信息传输速率。
[0146]
图5给出了不同算法平均信息传输速率随着时间的变化轨迹,每时隙的平均信息传输速率为从仿真开始到当前时隙的信息传输速率的平均值。仿真结果表明,本发明算法实现的理论和实际传输速率都比半功率算法和固定算法高。半功率算法和固定比例算法都只根据电池电量计算得到发送功率,而没有考虑信道状态变化带来的影响,因此性能要明显低于根据信道状态和能量约束进行了优化的本发明算法。离线注水算法的优化目标为最大化理论的长期平均信息传输速率,因此这种算法在平均信道容量上要优于本发明算法,相较于本发明算法有1.6%的优势。但由于离线注水算法没有联合优化调制阶数、编码信息位长度和发送功率这三个变量,而本发明算法则是以实际可达的传输速率最大化为目标进行这三个变量的联合优化,因此尽管信道容量低于离线注水算法,但实际可达的信息传输速率却要高于该算法,有9.4%的优势。
[0147]
图6给出了3种在线算法电池电量随时间的变化轨迹,离线注水算法直接对总收集能量进行功率分配,没有考虑电池电量的溢出情况,因此没有给出电池电量变化轨迹。仿真
结果显示,本发明所提出的算法电池电量能在一定水平上下波动,每时隙电池中都有足够的电量供信息传输,也为收集的能量留有足够的存储空间。而半功率算法在很短时间内消耗完事先存储的电量,随后电量稳定在一个很低的水平上;固定比例算法在消耗电量时过于保守,仅使用现有电池中存储电量的固定比例部分,没有根据信道状态进行调整,因此性能较低,同时由于电池剩余空间较小,出现收集能量溢出的可能性增大。
[0148]
为验证本发明算法的适用性,除了在能量到达过程为复合泊松均匀分布时进行了仿真外,还分别在随机风力发电模型、到达能量服从伯努利分布两种能量随机模型下进行了平均传输速率的仿真。(1)风力发电:风力发电模块输出电功率pa为
[0149]
pa=0.5ρsc
pvt3
η1η2[0150]
其中,ρ为空气密度,仿真取20℃时的密度1.22kg/m3;v
t
为随机变化的风速,采用四分量随机模型仿真得到;风能利用系数c
p
为0.593;s为扇叶的扫掠面积,与扇叶半径的关系为s=πr2;η1=0.94为齿轮箱的能量转换效率;η2=0.52为电机的能量转换效率。
[0151]
(2)伯努利分布:每时隙到达的能量为独立同分布的伯努利随机变量:
[0152][0153]
其中概率p为能量到达的概率。
[0154]
图7给出了能量服从复合均匀分布的泊松过程时,长期平均信息传输速率随能量到达率λ变化的仿真结果。随着能量到达率的增加,信号的平均发送功率增大,因此所有算法的平均信息传输速率都增大。相较于对比算法,本发明算法由于是以实际可达的传输速率最大化对发送功率、调制方式和编码参数进行联合优化,因此能获得更高的信息传输速率。由于固定比例算法和半功率算法未考虑信道条件,故实现的信息传输速率与本发明相差较大。而注水算法是以理论信道容量最大化进行优化,在实际可用的信道编码和调制下能达到的信息传输速率并不是最大的。
[0155]
图8给出风力发电模型下,不同扇叶半径r时长期平均传输速率的仿真结果。从图中可以看出,随着扇叶半径的增加,风力发电机的扫掠面积增大,输出的电功率增大,因此能获得更高的信息传输速率。本发明算法能达到的信息传输速率仍然是最高的,其次是离线注水算法,半功率算法最低。
[0156]
图9给出了能量服从伯努利分布时,不同能量到达概率p时长期平均传输速率的仿真结果。从图中可以看出,随着能量到达概率的增加,平均发送功率增大,信息传输速率也相应增大。与图8、图9类似,仍然是本发明算法能获得的传输速率最高,其次是离线注水算法,半功率算法最低。
技术特征:1.能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,其特征在于,包括以下步骤:(1)对通信系统进行建模,每时隙发送端从周围环境中收集能量用于向接收端发送信息,以最大发送功率限制、电池存储电量对发送功率的限制和电池电量变化为约束条件,以最大化长期时间平均传输速率为目标,构造优化问题;(2)利用lyapunov优化框架,发送端的电池电量加偏移后得到虚队列,再将传输速率的负值作为惩罚项,构建“漂移加惩罚”项,将受约束的最大化长期平均传输速率的优化问题转化为最小化“漂移加惩罚”项;(3)将最小化“漂移加惩罚”项转化为最小化“漂移加惩罚”项的上界;(4)根据能量到达及信道状态做出决策,寻找发送功率、调制方式、信息位长度最优组合,即求解优化目标函数的最优解。2.根据权利要求1所述能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,其特征在于:步骤(1)所述对通信系统进行建模包括对系统实际可达传输速率、发送端电池电量队列进行建模;所述系统实际可达传输速率为b表示信道带宽,m表示调制阶数,k为信息位长度,n为编码码长,r为纠错能力,p
eb
为误比特率,r
bt
为发送端在每时隙发送的信息比特数,p
cf
为正确译码的码字概率;所述发送端电池电量队列为p(t)=p
c
(t)+p
m
(t)+p
a
+p
t
(t)=p
cc
(t)+p
t
(t),p(t)表示发送端的功耗,p
t
(t)表示发送信号的功耗,p
cc
(t)表示电路的功耗,电路功耗分为编码电路功耗p
c
(t)、调制电路功耗p
m
(t)及其他电路功耗p
a
;p
c
(t)=σ1·
r
bt
σ1为一个常系数,与具体采用的编码方式、编码电路、电路参数有关;p
m
(t)=σ2·
blog2mσ2为一个常系数,具体数值与电路或信号处理器件有关。3.根据权利要求1或2所述能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,其特征在于:所述优化问题为征在于:所述优化问题为征在于:所述优化问题为m∈ωk∈k其中,e[
·
]表示期望运算,t
ts
为单位时隙,k为一个码字中可选信息位长度的集合,与
选用的信道编码有关;ω为可选用的调制方式的集合;p
d,max
为最大发送功率约束;e
b
(t)为电池存储电量约束;为长期电量约束,即所有收集的能量都用于信号发送,其中,分别为平均每时隙存储进电池的电能和总功耗。4.根据权利要求3所述能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,其特征在于:所述步骤(2)具体包括:具体为:将发送端的电池电量加一个偏移量后作为能量虚队列:x(t)=e
b
(t)-a式中,e
b
(t)为电池电量,a为偏移量,正常数;定义二次lyapunov函数lyapunov漂移定义为“漂移加惩罚”项为δ(x(t))-ve[r
b
(t)|x(t)]式中e[r
b
(t)]是优化的目标——平均传输速率,其负值为惩罚项,v是漂移和惩罚项之间的权重,为正常量,用于在队列稳定性和系统传输速率最大化间进行权衡,优化问题转化为最小化“漂移加惩罚”项,即项,即项,即m∈ωk∈k。5.根据权利要求4所述能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,其特征在于:所述步骤(3)具体包括:由能量更新公式和lyapunov函数的定义式有式中(e
b
(t)-t
ts
·
p(t))2为非负有限值,因此一定存在非负常数c满足于是有δx(t)≤c+x(t)e[e
h
(t)-t
ts
·
p(t)|x(t)]
用上式代替漂移,可得“漂移加惩罚”的上界为δx(t)-ve[r
b
(t)|x(t)]≤c+x(t)e[e
h
(t)-t
ts
·
p(t)|x(t)]-ve[r
b
(t)|x(t)]优化问题可以用“漂移加惩罚”上界的最小化来逼近,进一步去掉上界中的均值运算,并将速率的表达式,优化问题转化为单时隙的优化问题:并将速率的表达式,优化问题转化为单时隙的优化问题:m∈ωk∈k。6.根据权利要求5所述能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,其特征在于:所述求解最优解为,当x(t)≥0时,目标函数是信号发送功率p
t
(t)的单调增函数,此时,为使目标函数最大化,信号发送功率p
t
(t)应取在电池放电功率和存储能量支持下的最大值当x(t)<0时,将发送功率范围p
t,min
,p
t,max
]等分为数个大小为δ1的小区间,判断每一个小区间中是否包含极大值点,若该区间内包含极大值点,再采用黄金分割法找到该极大值点,在获得所有可用信道编码、调制方式组合下的最优发送功率后,比较它们的目标函数值f(p
t
(t),m,k),选择使目标函数最大的调制阶数和信息位长度组合,以及对应的发送功率为优化问题的解。
技术总结本发明公开了一种能量收集无线通信系统中发送功率、调制阶数和编码码率在线联合控制方法,针对发送端配备能量收集装置的点对点能量收集无线通信系统,在能量到达和信道状态的随机变化条件下,最大化长期平均传输速率。该方法利用Lyapunov优化框架将电池操作和可用能量约束下的、最大化长期平均传输速率的优化控制问题方法转化为每时隙以“虚队列漂移加惩罚”最小化为目标的多变量联合控制方法,并给出一种高效的数值求解方法。本发明还给出了一种基于滑动窗口的K-means聚类的“漂移加惩罚”中权重和虚队列偏移量两个参数的自适应调整方法。本发明给出的方法仅依赖于当前的电池状态和信道状态信息做出控制决策,计算复杂度低,实用性强。实用性强。实用性强。
技术研发人员:雷维嘉 刘美玎
受保护的技术使用者:重庆邮电大学
技术研发日:2022.06.23
技术公布日:2022/11/1