本发明涉及石油产量预测,具体是一种可解释多步石油产量预测方法与系统。
背景技术:
1、目前,产量预测是石油能源行业的一项基本任务。传统上,产量预测是通过求解或拟合经验物理公式来实现的。分析方法是建立渗流方程,以求解不同条件下基于流体流态的产量。然而,这种方法为了使方程可解,引入了许多理想化的假设。数值模拟使用渗流力学和计算机技术来模拟油藏的行为,这在实践中是费力的,并且严重依赖于先验地质模型。相比之下,衰减曲线分析(decline curve analysis ,dca)要简单得多,它使用预设的物理公式拟合过去的产量,从而来预测未来的产量。然而,这种方法对控制过程的考虑有限。因此,需要更先进的方案来解决传统产量预测方法的局限性。近年来,智能油田的研究进展为产量预测提供了新的观点。作为一种特殊的时间序列,生产动态连续记录了一口井的每日或每月产油量,这赋予了lstm、tcn和最近的transformer等深度神经网络巨大的应用潜力。与交通流量和用电量等一般时间序列不同,一般时间序列可以分解为趋势、季节性和噪声(即残差),生产动态表现出由趋势、局部波动和噪声组成的特殊特征。具体来说,实际的油藏不是纯粹的自然系统,而是受自然规律和人类干预影响的混合系统。一方面,由于储层渗透率和压力的降低,油气产量自然呈现下降趋势。另一方面,工程师将调整钻井参数和开发措施来提高石油采收率,这可能会导致局部产量波动。例如,当实施了酸化措施,就会提高储层渗透率,从而显著提高了产量。由于这些波动突然且不规则地出现,所以很容易与噪声混淆。因此,产量曲线的分析不仅要考虑长期特征和局部模式,还要区分局部波动和噪声干扰。这使得产量预测任务特别具有挑战性。除了不考虑产量数据的特异性外,大多数深度神经网络(dnn)由于其强烈的非线性导致产生的预测具有较差的可解释性,这给产量预测带来了另一个挑战。
2、如上所述,油藏受到酸化操作和生产时间等工程措施的影响。这些外源因素是人为可控的,可以在油藏开发方案中预先规划。然而,不同因素对实际生产的影响仍然未知。忽视这一影响过程并采用黑箱预测模型,将使工程师难以深入了解提高石油采收率的原因,从而阻碍预测模型优化策略的制定。
技术实现思路
1、本发明要解决的技术问题是提供一种可解释多步石油产量预测方法与系统,引入了聚合多头注意力来直观地呈现相关影响关系,构建的可解释transformer模型学习了生产动态的解耦局部趋势表示,同时实现了在时间模式和外源因素影响方面的可解释性。
2、本发明的技术方案为:
3、一种可解释多步石油产量预测方法,具体包括有以下步骤:
4、(1)、定义多步石油产量预测的目标,具体见下式(1):
5、(1);
6、式(1)表示在给定和的情况下预测;生产过程中总共生成了n个时间序列样本,表示为;,表示一口井在历史t时间步长下的石油产量;,表示外源因素;是外源因素类型的数量;表示未来m时间步长;表示可学习参数;
7、(2)、构建可解释transformer模型,包括有局部放大器、可解释外源注意力和可解释时间注意力,可解释外源注意力即iea模块,可解释时间注意力即ita模块;局部放大器通过增强对外源因素引起的局部波动的位置感知,同时抑制噪声,来提取有效的局部增强信息,从而区分局部波动和噪声;可解释外源注意力在协变量维度上建立了外源因素与生产之间的因果关系,掌握外源因素对目标产量的影响;可解释时间注意力在时间维度上连接历史和未来的石油产量,以学习长期的生产行为,从而捕获长期的时间依赖性;
8、(3)、采集真实的历史产量数据集,然后对可解释transformer模型进行训练和测试,得到训练并优化好的可解释transformer模型,最后采用训练并优化好的可解释transformer模型来预测未来m时间步长下的石油产量。
9、所述的可解释transformer模型包括有编码器和解码器,编码器包括有顺次连接的输入嵌入层、局部放大器、iea模块和前馈层,解码器包括有顺次连接的输入嵌入层、局部放大器、iea模块、ita模块和前馈层;解码器的iea模块和前馈层的输出,以及解码器的iea模块、ita模块和前馈层的输出均进行了残差层归一化连接处理。
10、所述的局部放大器的具体处理过程如下:
11、s11、给定输入嵌入和,表示经特征提取后的嵌入特征、即历史产量嵌入,表示经特征提取后的嵌入特征、即外源因素嵌入,然后将输入嵌入输入seq2seq层,并获得初始产量,是输入嵌入的特征维度,处理过程见下式(2):
12、(2);
13、式(2)中,,是可学习的参数;是seq2seq层;
14、s12、对外源因素嵌入执行两次连续的1d卷积,然后进行softmax激活,获得位置注意力系数,处理过程见下式(3):
15、(3);
16、式(3)中,表示外源因素嵌入的位置注意力系数,和表示两次连续的1d卷积,表示softmax激活函数;
17、s13、用刺激以重塑局部表征的分布,并执行卷积,以在受刺激的表征上学习丰富的局部增强信息,处理过程见下式(4):
18、(4);
19、式(4)中,表示维度扩展后的元素乘积,表示卷积操作,表示局部增强信息。
20、所述的iea模块的处理过程具体如下:
21、s21、给定外源因素嵌入或、以及局部增强信息或,进行线性投影,具体是将或投影到个查询中,将或投影在个键和一个值中,处理过程见下式(5)和式(6):
22、(5);
23、(6);
24、式(5)和式(6)中,下标e代表编码器,下标d代表解码器,下标,是iea模块头部的数量;q代表query、即查询;k代表key、即键;
25、代表valu、即多个头部共享的相同的值;、、、、、分别表示不同线性投影的权值向量;
26、s22、采用amha来对齐每个查询和键,生成统一的聚合外源注意力矩阵;
27、amha代表aggregations multi-head attention,即聚合多头注意力,处理过程见下式(7):
28、(7);
29、式(7)中,表示卷积;表示聚合外源注意力矩阵;代表多个头部共享的相同的值;表示聚合外源注意力矩阵的权值向量;为通道描述符,描述了每个注意力矩阵的重要性,并作为逐点卷积核来重新校准每个头部对聚合的响应;是排列的注意力矩阵,,均是输入时间步长的数量,表示iea模块头部的数量或ita模块头部的数量;表示门控机制;
30、由式(7)得到编码器中iea模块的聚合外源注意力矩阵和解码器中iea模块的聚合外源注意力矩阵,具体见下式(8)和式(9):
31、(8);
32、 (9);
33、式(8)和式(9)中,,,和包括时间维度和协变量维度,反映了每个外源因素在不同时间步长对石油产量的影响,和分别为编码器中iea模块和解码器中iea模块的输出,、分别表示不同线性投影的权值向量。
34、所述的通道描述符由下式(10)得到:
35、(10);
36、式(10)中,,表示对注意力矩阵进行全局最大池化,、是通道描述符的不同权值向量。
37、所述的ita模块的具体处理过程如下:
38、s31、编码器前馈层的输出为,解码器iea模块的输出为,将线性投影为个查询,将转换为个键和一个值,具体见下式(11):
39、(11);
40、式(11)中,,是ita模块头部的数量,、、分别表示不同线性投影的权值向量;
41、s32、计算时间amha,具体下式(12):
42、(12);
43、式(12)中,是聚合时间注意力矩阵;
44、s33、最后输入到前反馈层处理后,得到解码器的输出。
45、所述的解码器的前馈层的输出为,根据下式(13)获得预测的目标:
46、(13);
47、式(13)中,是预测的目标的权值向量;
48、最后通过最小化真实值和预测结果之间的均方误差损失,对可解释transformer模型进行训练和测试,得到训练并优化好的可解释transformer模型。
49、一种可解释多步石油产量预测系统,包括有数据采集模块、产量预测模块和训练优化模块;
50、数据采集模块用于采集历史产量数据集和对应的外源因素;
51、产量预测模块依据历史产量数据集和对应的外源因素采用可解释transformer模型进行未来产量的预测;
52、训练优化模块根据数据采集模块采集并更新的数据对可解释transformer模型进行训练和优化,得到训练并优化好的可解释transformer模型。
53、本发明的优点:
54、(1)、本发明可解释transformer模型中设置的局部放大器,用于增强工程即外源因素引起的局部波动,并从位置的角度来抑制噪声干扰,从而提取有效的局部增强信息,区分局部波动和噪声。
55、(2)、本发明可解释transformer模型中设置的iea模块处理得到的聚合外源注意力矩阵反映了每个外源因素在不同时间步长对石油产量的影响;除了提供动态影响的见解外,iea模块还选择性地减少了产量不敏感因素的影响,从而减少了不必要的噪声输入,且注意力计算在每个时间步长(以及每个头部内)都是独立的,从而实现了沿时间维度的并行计算。
56、(3)、本发明可解释transformer模型中设置的ita模块在时间维度上连接历史和未来的石油产量,以学习长期的生产行为,从而捕获长期的时间依赖性,处理得到的聚合时间注意力矩阵揭示了历史产量和未来产量之间的相关性。
57、(4)、本发明的iea模块和ita模块均采用聚合多头注意力机制,使多个头共享相同的值v,同时为每个头保留单独的查询q和键k,以保持搜索多样性;由聚合多头注意力机制推导得到的聚合注意力矩阵(聚合外源注意力矩阵和聚合时间注意力矩阵)具有三个特征:(i)简单,只有一个通道;(ii)通过多个q和k保证特征子空间的多样性;(iii)逻辑性,推导的每一步都保持了变量的物理意义;基于上述优点,聚合多头注意力机制大大提高了可解释transformer模型的可解释性,能直观地呈现影响石油产量因素的相关关系。
1.一种可解释多步石油产量预测方法,其特征在于:具体包括有以下步骤:
2.根据权利要求1所述的一种可解释多步石油产量预测方法,其特征在于:所述的可解释transformer模型包括有编码器和解码器,编码器包括有顺次连接的输入嵌入层、局部放大器、iea模块和前馈层,解码器包括有顺次连接的输入嵌入层、局部放大器、iea模块、ita模块和前馈层;解码器的iea模块和前馈层的输出,以及解码器的iea模块、ita模块和前馈层的输出均进行了残差层归一化连接处理。
3.根据权利要求2所述的一种可解释多步石油产量预测方法,其特征在于:所述的局部放大器的具体处理过程如下:
4.根据权利要求3所述的一种可解释多步石油产量预测方法,其特征在于:所述的iea模块的处理过程具体如下:
5.根据权利要求4所述的一种可解释多步石油产量预测方法,其特征在于:所述的通道描述符由下式(10)得到:
6.根据权利要求5所述的一种可解释多步石油产量预测方法,其特征在于:所述的ita模块的具体处理过程如下:
7.根据权利要求6所述的一种可解释多步石油产量预测方法,其特征在于:所述的解码器的前馈层的输出为,根据下式(13)获得预测的目标:
8.一种可解释多步石油产量预测系统,其特征在于:包括有数据采集模块、产量预测模块和训练优化模块;