本发明涉及石油勘探,尤其涉及一种微体古生物识别方法及装置。
背景技术:
1、微体古生物自动识别在油气勘探和古环境研究领域具有重要意义。微体古生物,如有孔虫、介形虫等,是沉积岩中常见的微小化石组成部分,它们的种类和分布对于理解地质历史、古生态环境,地层划分以及油气藏的形成和分布至关重要。
2、微体古生物的种类繁多,每一类都有其特定的生活环境和时代特征,因此在古生物地层学中,特定的微体古生物化石常被用作地质年代的标志。它们的出现和消失可以帮助科学家进行地层对比和年代划分,此外,微体古生物的分布和丰度能够反映古环境的条件,如水温、盐度、氧化还原条件等。通过分析这些微小化石,科学家可以重建古代地球的环境和气候。
3、由于微体古生物的尺寸极小,传统的识别方法主要依赖于对微体古生物扫描电镜图像的人工观察和分类。这种方法不仅耗时、耗力,而且受到专家经验和主观判断的限制,导致识别结果的一致性和准确性难以保证。此外,微体古生物种类繁多,形态复杂,给人工识别带来了巨大的挑战。同时,随着油处理和分析的样本量持续增加,这进一步加大了研究人员的工作量。
4、近年来,随着人工智能、机器学习、图像处理和计算机视觉技术的快速发展,自动化微体古生物识别成为了一种可行且有效的新方法。通过利用高分辨率的扫描设备和复杂的图像处理算法,可以自动识别和分类微体化石,从而显著提高工作效率,减少人力资源的消耗,并提高识别的准确性和一致性。
5、alexnet是第一个在imagenet大规模视觉识别挑战赛中取得胜利的深度卷积神经网络,标志着卷积神经网络在计算机视觉领域进入了一个新的阶段。在此之后,zfnet打破了深度神经网络的黑箱子,将卷积神经网络层的特征可视化,增加了网络内部操作的透明度,让深度卷积神经网络不在神秘。resnet通过引入残差学习框架,成功训练了上百层的网络,解决了深度网络的梯度消失问题。inception网络引入了多尺度的特征提取机制,通过并行不同大小的卷积核,捕捉不同尺度的图像特征。senet的识别准确率(97%)首次超过人眼识别的准确率(95%)。在此之后,复杂的卷积神经网络(如densenet,mobilenet)进一步提升了卷积神经网络的效果,并将其应用在复杂的图像数据集中(如jft-300m)。
技术实现思路
1、基于以上所述,本发明的目的在于提出一种微体古生物识别方法及装置,以实现对微体古生物类别的自动识别。
2、为达上述目的,本发明采用以下技术方案:
3、本技术的第一方面提供一种微体古生物识别方法,其包括:
4、获取待识别图像,所述待识别图像显示有微体古生物;
5、将待识别图像输入目标微体古生物识别模型,对待识别图像中的微体古生物类别进行自动识别,输出目标预测结果;
6、其中,所述目标微体古生物识别模型包括局部信息抽取模块、图像分块模块、自注意力模块、分类模块,以通过所述局部信息抽取模块采用卷积运算捕捉图像的局部信息;通过所述图像分块模块将输入图像分解成固定大小的图像块,并将每个图像块转换为向量形式,并向每个图像块加入位置编码;通过所述自注意力模块使用多头注意力机制和包括前馈神经网络的多层感知机对转换为向量形式的每个图像块进行处理,计算不同向量之间的关系从而捕捉图像的空间信息,通过所述多层感知机提升模型非线性拟合能力并且将特征向量映射到预测类别的概率分布上;通过所述分类模块汇总自注意力模块的学习信息,并引入类令牌将所有图像块的信息汇总,以产生目标预测结果。
7、在一些实施方式中,在所述将待识别图像放入所述目标微体古生物识别模型之前,还包括训练并获得所述目标微体古生物识别模型,所述训练并获得所述目标微体古生物识别模型包括:
8、拍照收集目标地层微体古生物,获得微体古生物图像数据;
9、对微体古生物图像数据依次进行类别归类,数据清洗与归一化处理,实现数据标准化;
10、将标准化的微体古生物图像数据按照预设比例划分出训练数据集、验证数据集与测试数据集,并构建microvit模型作为初始微体古生物识别模型;
11、基于所述训练数据集和所述验证数据集,利用随机梯度下降方法优化所述初始微体古生物识别模型,并迭代直至获得稳定且准确的优化微体古生物识别模型;
12、利用所述优化微体古生物识别模型对测试数据集中的微体古生物图像数据进行识别预测,得到识别预测结果;
13、将所述识别预测结果与测试数据集的标签微体古生物进行对比数值分析,并对所述优化微体古生物识别模型进行可视化分析,采用grradcam算法可视化类别热力图,判断优化微体古生物识别模型可靠度,以获得所述目标微体古生物识别模型。
14、在一些实施方式中,目标地层包括柴达木盆地路乐河组,下干柴沟组下段,下干柴沟组上段,上干柴沟组,下油砂山组,上油砂山组,狮子沟组地层;和/或者,
15、目标地层微体古生物包括微湖花介属,正星介属,柴达木花介属,半美星介属,柴北沟介属,南星介属,小玻璃介属;和/或者,
16、预设比例为7:2:1;和/或者,
17、所述归一化处理采用归一化公式实现,所述归一化公式为:
18、
19、式中,norm为标准化处理后的值,xi为图像像素点值,max(x)为图像像素的最大值,min(x)为图像像素的最小值。
20、在一些实施方式中,所述对微体古生物图像数据依次进行类别归类包括对微体古生物标注,将相同的微体古生物分类存放;和/或者,
21、数据清洗包括去除损坏的微体古生物图像数据与模糊的微体古生物图像数据。
22、在一些实施方式中,所述优化微体古生物识别模型包括2个局部信息抽取模块、5个自注意力模块和1个分类模块;和/或者,
23、在所述利用随机梯度下降方法优化所述初始微体古生物识别模型型的步骤中采用的优化器为adam,损失函数为交叉熵损失函数。
24、在一些实施方式中,所述基于所述训练数据集和所述验证数据集,利用随机梯度下降方法优化所述初始微体古生物识别模型,并迭代直至获得稳定且准确的优化微体古生物识别模型,包括:
25、将所述训练数据集的微体古生物图像输入到初步微体古生物自动识别模型中迭代m次,每次使用交叉熵损失函数优化损失,使损失值不断接近真实值,不断迭代最终准确率与损失趋于稳定,以获得获得稳定且准确的优化微体古生物识别模型,m≥≥25。
26、在一些实施方式中,所述将标准化的微体古生物图像数据按照预设比例划分出训练数据集、验证数据集与测试数据集,并构建microvit模型作为初始微体古生物识别模型,包括:
27、通过所述图像分块模块预设图像分块个数,按照大小相等的条件将测试数据集的图像均匀分割成多个图像块,将每个图像块转为一维向量,并加入位置编码;
28、将所有图像块输入到所述自注意力模块中,反复迭代学习图像块之间的关联关系,所述自注意力模块主要包括多头注意力机制和多层感知机,获得运算结果;
29、将运算结果放入所述分类模块中,获得预测结果,对预测结果分析后得到初始微体古生物自动识别模型。
30、在一些实施方式中,所述对所述优化微体古生物识别模型进行可视化分析,采用gradcam算法可视化类别热力图,判断优化微体古生物识别模型可靠度,以获得所述目标微体古生物识别模型,包括:
31、将测试数据集的图像放入优化微体古生物识别模型中进行前向传播,计算多层感知机的特征图并且得到测试数据集的图像所关注类别的预测分数;
32、计算特征图的梯度平均值,得到所述特征图对类别预测的权重;
33、将权重与特征图相乘得到原始类别热力图;
34、对原始类别热力图应用relu激活函数得到对预测类别具有正贡献的特征,得到目标类别热力图;
35、结合目标类别热力图判断优化微体古生物识别模型是否符合领域专家的专业知识后,得到目标微体古生物自动识别模型。
36、在一些实施方式中,所述目标微体古生物识别模型的运算流程包括:
37、将待识别图像放入图像抽取模块;
38、将经过图像抽取模块处理后的图像分割成n个大小相等且不重叠的图像块,然后将图像块展开为一维向量,并添加位置编码;
39、再将图像块放入自注意力模块中,自注意力模块包括多头注意力机制和多层感知机;其中,通过多头注意力机制使得每个图像块获得全局信息,然后将多头注意力机制的结果放入多层感知机中,多层感知机包括两个全连接前馈神经网络,两个全连接前馈神经网络之间插入非线性激活函数;其中,在经过多头注意力机制和多层感知机之前需经过层归一化;
40、在经过多头注意力机制和多层感知机之后进行残差链接运算;
41、通过分类模块将类令牌引入到图像块中,与经过自注意力模块学习后的图像块一起学习,所述分类模块包括多头注意力模块与多层感知机模块,在每个多头注意力模块与多层感知机模块之前进行层归一化,在每个多头注意力模块与多层感知模块之后加入残差连接,类令牌用于学习到全部图像块的信息,综合进行判断,最终得出分类效果。
42、本技术的第二方面提供了一种微体古生物识别装置,其包括:
43、至少一个处理器;以及,
44、与该至少一个处理器通信连接的存储器;其中,
45、该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行上述任一实施方式的微体古生物识别方法。
46、本发明的有益效果为:
47、本发明通过获取待识别图像;然后,将待识别图像输入目标微体古生物识别模型,对待识别图像中的微体古生物类别进行自动识别,输出目标预测结果。其中,所述目标微体古生物识别模型包括局部信息抽取模块、图像分块模块、自注意力模块、多层感知机、分类模块,以通过所述局部信息抽取模块采用卷积运算捕捉图像的局部信息;通过所述图像分块模块将输入图像分解成固定大小的图像块,并将每个图像块转换为向量形式,并向每个图像块加入位置编码;通过所述自注意力模块使用多头注意力机制和前馈神经网络对转换为向量形式的每个图像块进行处理,计算不同向量之间的关系从而捕捉图像的空间信息;通过所述多层感知机提升模型非线性拟合能力并且将特征向量映射到预测类别的概率分布上;通过所述分类模块汇总自注意力模块的学习信息,并引入类令牌将所有图像块的信息汇总,以产生目标预测结果。
48、本发明用于实现对微体古生物进行自动识别,在目标微体古生物识别模型中,自注意力模块可以增强图像的全局信息收集能力,最大程度模拟人眼观察的特点,分类模块用于综合之前的运算结果,综合学习到的信息最终进行微体古生物类别的智能识别。其不仅很好识别了不同地层具有代表性的微体古生物类别,远优于现有技术方案,更利于地层划分,油气勘探等相关工作的开展;而且模型结构参数较小,自动化程度高,有效降低了计算成本。识别的结果更加符合地质学家的专业知识。
1.一种微体古生物识别方法,其特征在于,包括:
2.根据权利要求1所述的微体古生物识别方法,其特征在于,在所述将待识别图像放入所述目标微体古生物识别模型之前,还包括训练并获得所述目标微体古生物识别模型,所述训练并获得所述目标微体古生物识别模型包括:
3.根据权利要求2所述的微体古生物识别方法,其特征在于,
4.根据权利要求2所述的微体古生物识别方法,其特征在于,
5.根据权利要求2所述的微体古生物识别方法,其特征在于,所述优化微体古生物识别模型包括2个局部信息抽取模块、5个自注意力模块和1个分类模块;和/或者,
6.根据权利要求5所述的微体古生物识别方法,其特征在于,所述基于所述训练数据集和所述验证数据集,利用随机梯度下降方法优化所述初始微体古生物识别模型,并迭代直至获得稳定且准确的优化微体古生物识别模型,包括:
7.根据权利要求2所述的微体古生物识别方法,其特征在于,所述将标准化的微体古生物图像数据按照预设比例划分出训练数据集、验证数据集与测试数据集,并构建microvit模型作为初始微体古生物识别模型,包括:
8.根据权利要求2所述的微体古生物识别方法,其特征在于,所述对所述优化微体古生物识别模型进行可视化分析,采用gradcam算法可视化类别热力图,判断优化微体古生物识别模型可靠度,以获得所述目标微体古生物识别模型,包括:
9.根据权利要求1-8中任一项所述的微体古生物识别方法,其特征在于,所述目标微体古生物识别模型的运算流程包括:
10.一种微体古生物识别装置,其特征在于,包括: