本发明涉及沙尘预报,具体地讲,是涉及一种基于深度学习的沙尘短临预报方法。
背景技术:
1、沙尘是指特定地理环境和下垫面条件下,由强风将地面大量尘土、沙粒卷入空中,使空气混浊、水平能见度下降的天气现象,具有突发性强、持续时间短、影响范围广的特点,会急剧降低能见度,并严重威胁生态环境安全、城市运行和人体健康。提高沙尘预报的精度是当前气象工作的重点和难点。利用对面观测站网,根据天气现象、能见度等观测要素,可以长时间、全天候的获得沙尘发生的时间、地点、强度等特征,同时基于卫星反演的沙尘实况产品能够时空连续地监测沙尘发展过程,这些沙尘监测数据是开展沙尘研究和预报的基础。
2、现有沙尘预报根据预报方法实现原理的不同可分为数值预报方法和机器学习预报方法。数值预报方法通过动力学方程组模拟沙尘排放、输送到沙尘的干或湿沉降来预报未来的沙尘状态,是目前沙尘预报业务上主要采用的方法。成熟的沙尘数值模式系统包括gocart、dream、itr等全球沙尘数值模式,以及cemsys5、cfors、narcm等区域沙尘数值模式,以及中国的cuace-dust,grapes-cuace/dust等。由于数值模式难以准确表示小规模的初始条件及在垂直和水平方向上都缺乏足够的分辨率,使其更适合长期预报。此外数值模式在生成沙尘形成和演变中涉及的关键参数仍然很困难,特别是在地形复杂或观测有限的地区,这使得预报结果具有一定的不确定性。
3、利用机器学习相关方法进行沙尘预报的主要思路是通过建模气象观测数据与沙尘天气相关观测数据之间的关系,实现对沙尘天气的预测。如lu等利用500hpa高度场、两个风场(u、v)和温度场等气象特征作为输入变量,构建了基于svm方法的沙尘暴日数预测模型。张振华等基于smote采样算法和决策树算法预测了甘肃省、新疆维吾尔自治区、宁夏回族自治区等西北地区逐月的沙尘暴日数。这些浅层神经网络、支持向量机等传统机器学习算法主要用于预测某地发生沙尘的概率,无法在实际业务应用。相对而言,深度神经网络不仅能够为复杂非线性系统提供建模,其更能够为模型提供更高的抽象层次,从而提高了模型的特征提取能力,已被广泛应用降水短临预报等。
4、沙尘短临预报是沙尘灾害预警预报的重要基础,人们更关注短时临近的沙尘预报效果,预报效率较高的潜势预报方法能帮助业务人员提前确定沙尘发生区域和范围,从而将主要精力放在重点区域内的预警。沙尘带来的低能见度可能导致交通事故、航班取消和道路封闭,从而造成人员伤亡和严重的经济损失。因而迫切需要一种效率更快、效果更好的沙尘短临预报方法,为民航中心、高速管理部门提供更好地气象服务支撑。
技术实现思路
1、针对上述现有技术中的上述问题,本发明提供一种基于深度学习的沙尘短临预报方法,将沙尘短临预报问题转换为沙尘实况序列预测问题,通过将多个连续的历史帧沙尘实况产品序列预测图输入网络中来得到几个小时后的短临预测图,通过判断预测图的区域和沙尘浓度来查看临近预报的沙尘发展情况,实现准确快速的沙尘短临预报。
2、为了实现上述目的,本发明采用的技术方案如下:
3、一种基于深度学习的沙尘短临预报方法,包括以下步骤:
4、s10、根据地面站点的观测数据筛选出沙尘过程数据,并根据沙尘过程数据的时间和空间匹配已有的基于卫星反演的沙尘实况数据;
5、s20、对步骤s10匹配后的数据进行预处理,形成沙尘时空序列样本集;
6、s30、基于predrnn网络构建时空序列的深度学习模型,并使用步骤s20的沙尘时空序列样本集训练获得沙尘浓度预测模型,表示为:
7、pt+1~pt+n=argmaxp(xt+1~xt+n|xt-j+1~xt)
8、xt+1~xt+n
9、上式中,xt-j+1~xt表示从时刻t-j+1到时刻t的历史沙尘浓度实况数据序列,xt+1~xt+n表示从时刻t+1到时刻t+n的沙尘浓度真值数据序列,pt+1~pt+n表示从时刻t+1到时刻t+n的沙尘浓度预测结果,即概率p最大的预测沙尘浓度时空数据序列,n<j;
10、s40、在发生沙尘天气时,将已有的基于卫星反演的沙尘实况数据输入步骤s30获得的沙尘浓度预测模型中,输出指定区域未来设定时间段内的沙尘分布结果,进行沙尘短临预报。
11、具体地,所述步骤s10中地面站点的观测数据包括地面国家气象站逐小时全要素数据中的能见度和天气现象数据,以及地面环保站的pm10数据;所述已有的基于卫星反演的沙尘实况数据为按时间序列的包含沙尘区和非沙尘区标记的沙尘格点图像。
12、具体地,所述步骤s10中根据沙尘过程数据和已有的基于卫星反演的沙尘实况数据进行时间和空间匹配的过程包括:
13、s11、收集历史沙尘过程中地面站点的观测数据,筛选出包含沙尘发生的开始时间和结束时间在内的时间信息以及包含沙尘发生站点的经纬度信息在内的空间信息;
14、s12、根据步骤s11获得的时间信息,筛选基于卫星反演的沙尘实况数据中含有相同时间信息的数据,完成数据的时间匹配;
15、s13、在时间匹配的条件下,根据步骤s11获得的空间信息从基于卫星反演的沙尘实况数据中提取反演结果数据,判断在指定区域内反演结果数据与观测数据是否一致,若是,则将该时间和空间下的基于卫星反演的沙尘实况数据纳入初始样本中。
16、具体地,所述步骤s20中对数据进行预处理,形成沙尘时空序列样本集的过程为:
17、s21、对步骤s10匹配后的数据进行区域裁剪,裁剪后构成256×512的网格;
18、s22、采用滑动窗口模式从裁剪后的数据中以每j+n个连续时刻的数据获取一个样本,并循环获取样本,形成样本集;
19、s23、采用最大最小值归一化方法,对每个样本进行标准化处理,并将空值赋值为0,获得沙尘时空序列样本集。
20、具体地,所述步骤s10中已有的基于卫星反演的沙尘实况数据为geotiff格式,所述步骤s20中沙尘时空序列样本集中样本格式存储为npy格式。
21、具体地,所述步骤s30中基于predrnn网络构建的时空序列的深度学习模型为堆叠式网络结构,输入的沙尘图像经过特征嵌入层从单通道图像转换为隐空间通道维度d为w的沙尘特征图,沙尘特征图经过堆叠式网络结构学习和特征降维层的处理,转换为单通道沙尘预测图像输出。
22、具体地,所述步骤s30中训练获得沙尘浓度预测模型的过程包括:
23、s31、模型训练初始参数设置:模型循环单元层数设置为4,基本单元之间的隐特征维度设置为64;损失函数设置为mse损失函数,初始学习率设定为0.0001;计划采样停止轮数设置为5000;滤波器大小设置为2;采用adamw优化器来最小化mse损失函数,通过其自适应梯度机制和动量梯度机制来调整学习率,加快模型收敛速度;最大迭代轮次设置为200;输入的时空序列长度设置为j,预测时空序列长度设置为n;
24、s32、模型开始训练:以沙尘时空序列样本集中的样本数据作为输入,设置输入沙尘浓度图像序列x1—xj[j,1,256,512],其中输入序列长度为j,灰度图通道数为1,图像网格大小为256×512,在训练过程中每个轮次验证一次模型效果并保存模型参数;
25、s33、模型学习:从输入沙尘浓度图像序列x1—xj[j,1,256,512]中按照时间维度每次抽取单张沙尘浓度图像xi[1,1,256,512],i=1,2,…,j,输入到模型中,循环此过程j次,经过特征嵌入、堆叠循环网络和特征降维,保存最后一次循环输出的特征图pj+1;
26、s34、模型预测:将步骤s33输出的特征图pj+1再输入到模型中,并输出时刻j+2的预测沙尘浓度图像pj+2,再将此预测沙尘浓度图像作为下一个循环的模型输入,输出时刻j+3的预测沙尘浓度图像pj+3,重复此过程直至获得预测沙尘浓度图像pj+n;
27、s35、模型调优:利用获得的预测沙尘浓度图像pj+1~pj+n和对应的真实沙尘浓度图像xj+1~xj+n计算mse损失函数,优化模型参数;
28、s36、重复执行步骤s33~s35,迭代优化模型参数,完成最大迭代轮次后保存模型参数,获得沙尘浓度预测模型,期间通过绘制loss曲线和评价指标曲线来观察模型学习情况。
29、具体地,所述基于predrnn网络构建的时空序列的深度学习模型以st-lstm单元为网络核心,包括多层堆叠的神经单元,通过时空记忆单元在层之间上下流动,通过长期记忆单元和隐藏层在层与层之间传递,通过输入时刻t-1的输入沙尘浓度图像xt-1,获得输出时刻t的预测沙尘浓度图像表示为:
30、
31、
32、上式中,xt为时刻t的输入沙尘浓度图像,[]符号表示拼接操作,*符号表示卷积操作,符号表示矩阵乘法,和分别表示第l层时刻t的长期记忆单元和时空记忆单元,表示第l层时刻t的隐藏层的值,gt、it和ft分别表示长期记忆单元c的调制门、输入门和遗忘门,gt’、it’和ft’分别表示时空记忆单元m的一组调制门、输入门和遗忘门,新增的一组门与传统的门机制公式相同,ot表示输出门,tanh和σ为相应的激活函数,wxg、wxi、wxf、whg、whi、whf、w′xg、w′xi、w′xf、wmg、wmi、wmf、wxo、who、wco和wmo表示相应卷积操作的权重,bg、bi、bf、b'g、bi'、b'f和bo表示可学习的偏移参数,w1×1表示用于提取拼接得到的特征图的空间特征1×1卷积操作权重。
33、作为优选,所述输入的时空序列长度设置为6,预测时空序列长度设置为3。
34、与现有技术相比,本发明具有以下有益效果:
35、本发明利用了基于静止卫星反演生成的高精度沙尘实况数据,结合地面站点的观测数据进行时空匹配形成沙尘时空序列样本集,来进行沙尘浓度预测模型的训练,充分发挥了卫星数据监测沙尘过程的优势,避免常规的观测站稀疏区域的站点观测或雷达观测无法全面、连续监测沙尘过程的限制,通过训练获得的沙尘浓度预测模型利用深度学习方法提高了沙尘短临预报的精度,有效弥补了业务中基于数值模式预报方法在短临时间段中性能不足的缺陷,整体提升了沙尘短临预报能力。
1.一种基于深度学习的沙尘短临预报方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于深度学习的沙尘短临预报方法,其特征在于,所述步骤s10中地面站点的观测数据包括地面国家气象站逐小时全要素数据中的能见度和天气现象数据,以及地面环保站的pm10数据;所述已有的基于卫星反演的沙尘实况数据为按时间序列的包含沙尘区和非沙尘区标记的沙尘格点图像。
3.根据权利要求2所述的基于深度学习的沙尘短临预报方法,其特征在于,所述步骤s10中根据沙尘过程数据和已有的基于卫星反演的沙尘实况数据进行时间和空间匹配的过程包括:
4.根据权利要求3所述的基于深度学习的沙尘短临预报方法,其特征在于,所述步骤s20中对数据进行预处理,形成沙尘时空序列样本集的过程为:
5.根据权利要求4所述的基于深度学习的沙尘短临预报方法,其特征在于,所述步骤s10中已有的基于卫星反演的沙尘实况数据为geotiff格式,所述步骤s20中沙尘时空序列样本集中样本格式存储为npy格式。
6.根据权利要求5所述的基于深度学习的沙尘短临预报方法,其特征在于,所述步骤s30中基于predrnn网络构建的时空序列的深度学习模型为堆叠式网络结构,输入的沙尘图像经过特征嵌入层从单通道图像转换为隐空间通道维度d为w的沙尘特征图,沙尘特征图经过堆叠式网络结构学习和特征降维层的处理,转换为单通道沙尘预测图像输出。
7.根据权利要求6所述的基于深度学习的沙尘短临预报方法,其特征在于,所述步骤s30中训练获得沙尘浓度预测模型的过程包括:
8.根据权利要求7所述的基于深度学习的沙尘短临预报方法,其特征在于,所述基于predrnn网络构建的时空序列的深度学习模型以st-lstm单元为网络核心,包括多层堆叠的神经单元,通过时空记忆单元在层之间上下流动,通过长期记忆单元和隐藏层在层与层之间传递,通过输入时刻t-1的输入沙尘浓度图像xt-1,获得输出时刻t的预测沙尘浓度图像表示为:
9.根据权利要求8所述的基于深度学习的沙尘短临预报方法,其特征在于,所述输入的时空序列长度设置为6,预测时空序列长度设置为3。
