1.本发明涉及钻井周期预测领域,具体涉及一种基于一维卷积神经网络的海洋钻井周期预测方法。
背景技术:2.在过去的几十年里,全球范围内的快速工业化使能源需求显著增加,探明油气储备开发油气资源变得更加普遍。探井是为了寻找石油和天然气而钻的,其主要目的是收集地下条件信息,并确认地质地层是否含有碳氢化合物。
3.钻井周期作为海洋石油钻井工程投资测算的关键参数,对保证油气田勘探开发整体目标按计划实现和及时投产尽早回收投资有重要意义。因此,准确预测海洋钻井周期是油气勘探开发规划中的一项重要工作。目前针对钻井周期预测的方法有:
4.(1)典型案例法:即通过类比邻井或相邻区块的地质资料,并借鉴其实际钻井周期数据推算出新井的钻井周期的方法。此方法常用于新区预探井的周期设计,但邻井在数量上有限,预测精度受邻井数据质量影响较大,并且邻井在钻井工序、完钻井深等数据上可能与新井有所差异,对新井钻井周期预测参考有限。
5.(2)经验估算法:经验估算法是根据施工技术人员的现场经验,通过研讨会来制定目标工序或钻井作业时间的一种方法。此方法耗时短,工作量小且简便易行,但其准确度在很大程度上取决于评估人员的经验,通常适用于现场作业方案讨论,在钻井方案编制或钻井设计阶段不现实。
6.(3)历史水平法:即根据往年同地区同类型钻井的实际生产数据,统计平均值来确定钻井周期的方法。该方法比较笼统简单,是比较常用的方法,但该方法基于统计学方法,误差较大。
7.(4)周期定额法:周期定额法是指统计完成一项工作所必需消耗的时间。此方法计算结构合理、数据贴近实际,但该方法数据统计整理分析的任务繁重,不适合大量钻井的油田,只适合井数较少的油气田使用。
8.(5)学习曲线法:该方法提出当某一区域进行一系列井身结构和作业步骤类似井的钻井工作时,钻井周期可以用学习曲线进行拟合,通过对学习曲线的分析,可以评估作业者的管理能力和技术水平,描述钻井作业遇到的问题。但学习曲线方法对井的选取限制条件较多,预测准确度较低,不适合海上钻井周期预测。
9.综上,现有预测目标井的钻井周期的方法预测精度难以保证,预测过程繁琐,依赖邻井数据,无法考虑钻井参数中的非线性关系,使得预测精度较低。
技术实现要素:10.针对现有技术中的上述不足,本发明提供的基于一维卷积神经网络的海洋钻井周期预测方法解决了现有预测目标井的钻井周期的方法预测精度较低、预测过程繁琐的问题。
11.为了达到上述发明目的,本发明采用的技术方案为:
12.提供一种基于一维卷积神经网络的海洋钻井周期预测方法,其包括以下步骤:
13.s1、获取并基于各井段钻进次数都为一次的海洋钻井的钻井历史数据,构建训练数据集;其中钻井数据包括开钻年份、所处盆地、完钻井深、各井段的钻头尺寸、各井段的套管尺寸、各井段顶深、各井段钻深和钻井周期;
14.s2、搭建一维卷积神经网络模型,通过训练数据集对一维卷积神经网络模型进行训练;
15.s3、获取并基于待预测钻井周期的海洋钻井的设计基础数据,构建预测数据集;其中设计基础数据包括开钻年份、所处盆地、完钻井深、各井段的钻头尺寸、各井段的套管尺寸、各井段顶深和各井段钻深;
16.s4、采用训练后的一维卷积神经网络模型对预测数据集进行处理,获取预测的海洋钻井周期。
17.进一步地,步骤s1中构建训练数据集的具体方法包括以下步骤:
18.s1-1、对完钻井深、各井段的钻头尺寸、各井段的套管尺寸、各井段顶深和各井段钻深中不足六开的数据进行补零至六开,完成数据预处理;
19.s1-2、对开钻年份和所处盆地进行独热编码,对预处理后的数据按类型分别进行全局归一化;
20.s1-3、将同一口井对应的独热编码得到的向量和全局归一化得到的向量进行拼接,得到训练样本;
21.s1-4、将已知的钻井周期作为对应训练样本的标签,得到训练数据集。
22.进一步地,步骤s2中一维卷积神经网络模型包括依次连接的输入层、一维卷积层c1、一维卷积层c2、一维最大池化层、dropout层、全连接层和输出层;其中:
23.一维卷积层c1、一维卷积层c2的激活函数均为relu函数,全连接层的激活函数为linear激活函数,一维卷积层c1、一维卷积层c2和一维最大池化层的填充方式为valid;
24.一维卷积层c1的卷积核长度为3,卷积核个数为64个,步长为1,输出的特征子序列长度为31,个数为64;
25.一维卷积层c2的卷积核长度为3,卷积核个数为64个,步长为1,输出的特征子序列长度为29,个数为64;
26.一维最大池化层的下采样区域长度为4,输出的特征子序列长度为7,个数为64;
27.dropout层的随机失活概率为0.4,包括448个节点;
28.输出层的输出节点为1。
29.进一步地,步骤s2中通过训练数据集对一维卷积神经网络模型进行训练的具体方法包括以下子步骤:
30.s2-1、将训练数据集分为训练集和验证集;
31.s2-2、将训练集中的样本输入当前一维卷积神经网络模型,将当前一维卷积神经网络模型对应的输出作为其预测值;
32.s2-3、基于预测值和真实标签,采用mse损失函数获取代价误差;
33.s2-4、判断代价误差是否达到预设迭代要求,若是则进入步骤s2-6,否则进入步骤s2-5;
34.s2-5、基于代价误差进行反向传播,更新一维卷积神经网络模型中各网络层的权重和偏置,返回步骤s2-2;
35.s2-6、将验证集中的m个样本分别输入当前一维卷积神经网络模型,获取对应的m个预测值;
36.s2-7、统计m个预测值的预测误差,判断预测误差是否达到预设要求,若是则输出当前一维卷积神经网络模型,完成训练;否则调整一维卷积神经网络模型的超参数并返回步骤s2-2。
37.进一步地,步骤s3中构建预测数据集的具体方法为:采用与构建训练样本相同的方法对设计基础数据进行处理,得到预测数据集。
38.本发明的有益效果为:本方法无需领域专家的经验知识,可根据海洋钻井设计参数自动预测海洋钻井周期,实现了端到端训练、预测的模型框架,实验表明,本方法可有效解决海洋钻井周期预测依赖邻井数据的问题,解决统计概率学方法无法考虑钻井参数中的非线性关系而精度有限的问题,利用神经网络在非线性关系拟合方面的优越性,结合一维卷积神经网络局部感知的特性,最终显著提高了预测结果的准确率。
附图说明
39.图1为本发明的流程示意图;
40.图2为以mse为损失函数,一维卷积神经网络训练过程中训练集和验证集损失值与迭代次数关系图;
41.图3为实施例中本方法的预测效果图。
具体实施方式
42.下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
43.如图1所示,该基于一维卷积神经网络的海洋钻井周期预测方法包括以下步骤:
44.s1、获取并基于各井段钻进次数都为一次的海洋钻井的钻井历史(日志)数据,构建训练数据集;其中钻井数据包括开钻年份、所处盆地、完钻井深、各井段的钻头尺寸、各井段的套管尺寸、各井段顶深、各井段钻深和钻井周期;钻进次数为完成一个井段需要下钻、纯钻进、起钻这一完整过程的次数,钻完一口井最多有六个井段;
45.s2、搭建一维卷积神经网络模型,通过训练数据集对一维卷积神经网络模型进行训练;
46.s3、获取并基于待预测钻井周期的海洋钻井的设计基础数据,构建预测数据集;其中设计基础数据包括开钻年份、所处盆地、完钻井深、各井段的钻头尺寸、各井段的套管尺寸、各井段顶深和各井段钻深;
47.s4、采用训练后的一维卷积神经网络模型对预测数据集进行处理,获取预测的海洋钻井周期。
48.步骤s1中构建训练数据集的具体方法包括以下步骤:
49.s1-1、对完钻井深、各井段的钻头尺寸、各井段的套管尺寸、各井段顶深和各井段钻深中不足六开的数据进行补零至六开,完成数据预处理;
50.s1-2、对开钻年份和所处盆地进行独热编码,对预处理后的数据按类型分别进行全局归一化;
51.s1-3、将同一口井对应的独热编码得到的向量和全局归一化得到的向量进行拼接,得到训练样本;
52.s1-4、将已知的钻井周期作为对应训练样本的标签,得到训练数据集。
53.全局归一化的计算公式为:
[0054][0055]
其中表示样本的某一类数据中第i个数据xi全局归一化后的结果,min(x)表示样本的该类数据中的最小值,max(x)表示样本的该类数据的最大值。例如在对一开钻深进行全局归一化时,则拿所有井的一开钻深数据,对每一口井做归一化,最大值是所有一开钻深的最大值。
[0056]
步骤s2中一维卷积神经网络模型包括依次连接的输入层、一维卷积层c1、一维卷积层c2、一维最大池化层、dropout层、全连接层和输出层;其中:
[0057]
一维卷积层c1、一维卷积层c2的激活函数均为relu函数,全连接层的激活函数为linear激活函数,一维卷积层c1、一维卷积层c2和一维最大池化层的填充方式为valid;
[0058]
一维卷积层c1的卷积核长度为3,卷积核个数为64个,步长为1,输出的特征子序列长度为31,个数为64;
[0059]
一维卷积层c2的卷积核长度为3,卷积核个数为64个,步长为1,输出的特征子序列长度为29,个数为64;
[0060]
一维最大池化层的下采样区域长度为4,输出的特征子序列长度为7,个数为64;
[0061]
dropout层的随机失活概率为0.4,包括448个节点;
[0062]
输出层的输出节点为1,最终输出为一维1个元素的行向量或者列向量。
[0063]
步骤s2中通过训练数据集对一维卷积神经网络模型进行训练的具体方法包括以下子步骤:
[0064]
s2-1、将训练数据集分为训练集和验证集;
[0065]
s2-2、将训练集中的样本输入当前一维卷积神经网络模型,将当前一维卷积神经网络模型对应的输出作为其预测值;
[0066]
s2-3、基于预测值和真实标签,采用mse损失函数获取代价误差;
[0067]
s2-4、判断代价误差是否达到预设迭代要求,若是则进入步骤s2-6,否则进入步骤s2-5;
[0068]
s2-5、基于代价误差进行反向传播,更新一维卷积神经网络模型中各网络层的权重和偏置,返回步骤s2-2;
[0069]
s2-6、将验证集中的m个样本分别输入当前一维卷积神经网络模型,获取对应的m个预测值;
[0070]
s2-7、统计m个预测值的预测误差,判断预测误差是否达到预设要求,若是则输出当前一维卷积神经网络模型,完成训练;否则调整一维卷积神经网络模型的超参数并返回
步骤s2-2。一维卷积神经网络模型的超参数包括学习速率、dropout、迭代次数;
[0071]
mse损失函数的表达式为:
[0072][0073]
其中yi表示真实标签,f(xi)表示预测标签,mse表示代价误差。以mse为损失函数,一维卷积神经网络训练过程中训练集和验证集的损失值与迭代次数关系图如图2所示。
[0074]
步骤s3中构建预测数据集的具体方法为:采用与构建训练样本相同的方法对设计基础数据进行处理,得到预测数据集。
[0075]
在具体实施过程中,本方法中的钻井周期为钻井达到设计深度所用进尺作业时间和固井作业时间,不包括天气等待时间和停工导致的非生产时间;其中:
[0076]
进尺作业:进尺作业是指利用机械设备将不同地层钻成指定孔眼的过程。进尺作业周期包括进尺时间和进尺辅助时间,其中进尺时间包括纯钻进、扩眼钻进、起下钻和接单根时间;进尺辅助时间包括循环、测斜、短起下钻等时间。
[0077]
固井作业:固井是指向井内下入套管并向井眼和套管之间的环形空间注入水泥的施工作业。固井作业周期由准备工作、下套管、起下内管、注水泥、侯凝、拆装井口、钻水泥塞和测固井质量时间组成。
[0078]
卷积计算后,为了增加神经网络模型的非线性,需要引入激活函数。修正线性单元(rectified linear unit,relu)函数能加速网络的收敛,防止梯度消失,其表达式为relu(x)=max(0,x),因此卷积层每个神经元的最终输出为(x)=max(0,x),因此卷积层每个神经元的最终输出为为第t层第k个神经元的输入。
[0079]
池化层可加快计算速度、降低计算代价和防止过拟合问题,且可保持特征的平移不变性。本方法采用最大值池化,即取一段相邻区域h内的最大值作为该区域的最终输出,表达式为
[0080]
dropout是指深度学习训练过程中,为防止模型过拟合,让隐藏层的神经元在每次迭代时(包括正向和反向传播)有一定几率失效。
[0081]
在本方法采用的一维卷积神经网络中,一维卷积层从序列中提取局部一维序列段(即子序列),其每个输出时间步都是利用输入序列在时间维度上的一小段得到的,即可以识别序列中的局部模式。因为对每个序列段执行相同的输入变换,所以在序列中某个位置学到的模式稍后可以在其他位置被识别,这使得一维卷积神经网络具有平移不变性(对于时间平移而言)。一维池化层用于在一维卷积神经网络中用于对时间序列进行时间下采样。即从输入中提取一维序列段(即子序列),然后输出其最大值(最大池化)或平均值(平均池化)。该运算用于降低一维输入的长度(子采样),减小网络的计算复杂度,同时还具有保持特征尺度不变形的功能,减少过拟合现象。
[0082]
在本发明的一个实施例中,为了验证方法的准确性和有效性,选取验证集50口井作为模型验证,所采用的部分数据如表1、表2和表3所示。独热编码将属性值转为二进制值,对应位用“1”表示一种类别或属性。在本实施例中,如果开钻年份在2015年之前(包括2015年),则编码为01,如果开钻年份在2016年之后(包括2016年),则编码为10。所处盆地具体包括盆地a、盆地b、盆地c、盆地d、盆地e和盆地f,当处于盆地a时,编码为100000,当处于盆地b
时,编码为010000。
[0083]
表1
[0084]
2015年(包括15年)前2016年(包括2016年)后盆地a盆地b盆地c盆地d盆地e盆地f完钻井深一开钻头尺寸一开套管尺寸010000010.61035196711100000100.43871635611010100000.1291925470.70.63898917011000000.5846790890.0750100000100.40207039311
[0085]
表2
[0086]
一开顶深一开钻深二开钻头尺寸二开套管尺寸二开顶深二开钻深三开钻头尺寸三开套管尺寸三开顶深三开钻深四开钻头尺寸0.0784241720.0102180880.4285714290.6690.0774473360.2542691260.70.7174887890.3016949150.7698834230.6938775510.0411792480.022944944110.0494062370.164040301110.2035439140.4890531710.0141635630.0263840170.4285714290.6690.0251445680.1276639340.703.156240370.28376457200.0136389870.6194906210.2142857140.480.4262185050.6468579230.48571428600.8640986130.25618424800.0377695010.017080982110.0420797190.178278689113.212018490.3915268691
[0087]
表3
[0088]
四开套管尺寸四开顶深四开钻深五开钻头尺寸五开套管尺寸五开顶深五开钻深六开钻头尺寸六开套管尺寸六开顶深六开钻深00.7677592270.0561198740000000010.4957443660.1662066250.98588235310.540300810.069236260.9800.6055352480.227677464000000000000000000000010.4300407970.2239747630.98588235300.5077130740.1356174160000
[0089]
根据下述关系式判定拟合优度的趋势:
[0090][0091]
其中r2表示相关系数,用于表征所述拟合优度的趋势,ssr为回归平方和,sse为残差平方和,sst为总离差平方和,为真实标签的平均值,m为训练样本个数。
[0092]
根据下述关系式判定平均绝对百分比误差:
[0093][0094]
根据下述关系式判均方根误差:
[0095][0096]
在具体的预测过程中,本方法的预测效果如图3所示,本方法与采用bpnn和采用xgboost的方案的结果对比如表4所示。
[0097]
表4
[0098]
方法maermsemape/%r2/%本发明方法0.991.6512.1391.97bpnn2.514.2516.1083.44xgboost2.413.9616.6585.60
[0099]
可以看出,本方法在mae、rmse、mape、r2指标上均优于采用bpnn(bp神经网络)和采用xgboost模型的方案。
[0100]
综上所述,本方法无需领域专家的经验知识,可根据海洋钻井设计参数自动预测海洋钻井周期,实现了端到端训练、预测的模型框架,实验表明,本方法可有效解决海洋钻井周期预测依赖邻井数据的问题,解决统计概率学方法无法考虑钻井参数中的非线性关系而精度有限的问题,利用神经网络在非线性关系拟合方面的优越性,结合一维卷积神经网络局部感知的特性,最终显著提高了预测结果的准确率。
技术特征:5;s2-5、基于代价误差进行反向传播,更新一维卷积神经网络模型中各网络层的权重和偏置,返回步骤s2-2;s2-6、将验证集中的m个样本分别输入当前一维卷积神经网络模型,获取对应的m个预测值;s2-7、统计m个预测值的预测误差,判断预测误差是否达到预设要求,若是则输出当前一维卷积神经网络模型,完成训练;否则调整一维卷积神经网络模型的超参数并返回步骤s2-2。5.根据权利要求2所述的基于一维卷积神经网络的海洋钻井周期预测方法,其特征在于,步骤s3中构建预测数据集的具体方法为:采用与构建训练样本相同的方法对设计基础数据进行处理,得到预测数据集。
技术总结本发明公开了一种基于一维卷积神经网络的海洋钻井周期预测方法,其包括以下步骤:根据历史数据构建训练数据集;搭建并训练一维卷积神经网络模型;根据海洋钻井设计基础数据构建预测数据集;采用训练后的一维卷积神经网络模型对预测数据集进行处理,获取预测的海洋钻井周期。本发明无需领域专家的经验知识,可根据海洋钻井设计参数自动预测海洋钻井周期,实现了端到端训练、预测的模型框架,本方法可有效解决海洋钻井周期预测依赖邻井数据的问题,解决统计概率学方法无法考虑钻井参数中的非线性关系而精度有限的问题,利用神经网络在非线性关系拟合方面的优越性,结合一维卷积神经网络局部感知的特性,最终显著提高了预测结果的准确率。的准确率。的准确率。
技术研发人员:姜莹 吴玉林 钱育蓉 刘永强 赵鑫
受保护的技术使用者:北京油源恒业科技有限公司
技术研发日:2022.07.11
技术公布日:2022/11/1