一种基于XGBoost的多尺度特征融合遥感图像分类模型

专利2023-10-10 114

一种基于xgboost的多尺度特征融合遥感图像分类模型
技术领域
1.本发明涉及遥感图像场景分类领域，特别是涉及一种基于xgboost的多尺度特征融合遥感图像分类模型。

背景技术：

2.人们试图从遥感图像中获取更多的类别信息，而深度学习在遥感图像处理及识别中取得很大的成功。
3.其中卷积神经网络(cnn)的网络架构在空间上普遍以局部建模形式存在,较强的细节捕捉能力使得它们在全局建模能力上表现较弱,对于全局表征信息的学习欠佳。transformer架构所拥有的动态注意力机制、全局建模能力，很好的弥补了cnn全局建模能力较弱的问题，但是传统的cnn和vit所包含的分类器层多尺度的数据特征时分类效果不佳。
4.mobilevit是一种用于移动设备的轻量级通用可视化transformer。它主要由卷积神经网络和基于自注意力机制的vit组成，其中卷积神经网络善于提取局部特征信息，基于自注意力机制的vit善于提取全局特征信息，它结合cnn和vit的优势可以得到高性能的数据提取模型。
5.集成学习算法通过将多个弱分类器组合为强分类器来提高模型的稳定性和准确性。xgboost属于集成学习算法中的一种,是gbdt算法上的提升。xgboost算法对损失函数做了二阶的泰勒展开提高了模型准确率，并在目标函数之中加入了正则项对整体求最优解，用以权衡目标函数的下降和模型复杂程度，避免过拟合。在应用于数据分类时具有很好的性能优势，利用xgboost作为模型的分类器替代传统cnn的全连接层进行分类，可以提高网络的分类性能。
6.由于低层特征分辨率更高，包含更多位置、细节信息，但是由于经过的卷积更少，其语义性更低，噪声更多。高层特征具有更强的语义信息，但是分辨率很低，对细节的感知能力较差。将不同尺度的特征信息进行融合可以得到更多的语义信息。
7.粒子群智能优化算法是将任意一群不具备体积和质量的粒子先进行初始化过程，从而把每一个粒子近似看作待优化的问题的可行解，对于这个可行解的大空间，粒子可在其中随机移动，通过迭代找到最优解。

技术实现要素：

8.本发明的目的是为了提高在遥感图像分类领域中分类准确率，提出了一种基于xgboost的多尺度特征融合遥感图像分类模型，本方法使用了改进的mobilevit模型、xgboost模型、粒子群智能优化算法，以提高遥感图像分类领域中的分类准确率。
9.本发明的目的可以通过以下技术方案来实现：
10.一种基于xgboost的多尺度特征融合遥感图像分类模型，包括以下步骤：
11.1)预处理数据集。将数据集按照4：1的比例分为训练集和测试集，为了增强有关信
息的可检测性和最大限度地简化数据,我们对训练集数据进行了一系列数据增强处理。
12.2)训练new-mobilevit模型。本发明在mobilevit网络中加入了通道空间注意力机制和辅助分类器,形成new-mobilevit网络以用于遥感图像的多尺度特征提取；
13.3)利用训练好的new-mobilevit网络提取图片特征。将训练样本输入到预设的特征提取主干网络中，进行多尺度的特征提取；
14.4)将训练集图片提取的多尺度特征值存入excel表格；
15.5)利用xgboost特征选择将浅层、中间层和深层特征信息根据特征重要程度进行倒序排序；
16.6)将xgboost的六个重要参数和四个不同尺度特征的特征维度组合，利用粒子群智能优化算法进行迭代寻优；
17.7)使用优化后的xgboost模型对特征选择后的多尺度信息进行分类生成最终模型。
18.所述步骤1)中，获取原始数据集是2015年武汉大学所发布的遥感影像数据集rsscn7 data set，该数据集作为遥感图像场景分类的常用数据集之一,包含了来自7个典型的场景类别——草地、田野、工业、河湖、森林、居民、停车场。该数据集中每张图像的像素值大小为400
×
400,每个类别有400张图像,分别基于4个不同的尺度进行采样,共有2800张。这些图像来源于不同季节和天气变化,并以不同的比例进行采样,场景图像的多样性导致其具有较大的挑战性。
19.所述步骤1)中，获取原始数据集是ucm土地利用数据集由2100张图像组成，这些图像分为21个典型的土地利用场景类别：农业、飞机、棒球场、海滩、建筑物、丛林、密集住宅、森林、高速公路、高尔夫球场、港口、十字路口、中型住宅、移动房屋公园、立交桥、停车场、河流、跑道、稀疏住宅、储罐和网球场。每个类别包含100个256
×
256像素的光学图像。
20.所述步骤1)中，数据增强方法，首先通过随机裁剪将图片大小固定为256
×
256,再进行随机水平旋转,然后进行归一化处理等操作。通过数据增强提高模型的泛化能力,增加噪声数据,提升了模型的鲁棒性；
21.所述步骤2)中，辅助分类器的四个loss值输出的加权系数依次为0.3、0.3、0.3、1.0,网络中loss值的计算公式如下所示：
22.loss＝loss0+loss1*0.3+loss2*0.3+loss2*0.3
ꢀꢀꢀꢀꢀ
(1)
23.所述步骤5)中，xgboost特征选择方法，先将rsscn7、ucm数据集按照4:1比例划分为训练集和测试集，利用训练集训练默认参数的xgboost分类模型，按照训练好的模型特征重要性对特征进行排序，选择特征重要性高的特征；
24.所述步骤6)中，粒子群优化算法中，粒子群的维度设置为10维，分别为学习率learning_rate、树的棵树n_estimators、最大树深度max_depth、最小叶子节点权重min_child_weight、gamma值、随机采样比例subsample以及4个不同尺度特征的特征维度；
25.所述步骤6)中，粒子群优化算法中，粒子的适应度函数为xgboost分类模型的准确率；
26.本发明的有益效果是：
27.一、本发明提出了一种新的基于xgboost的多尺度特征融合遥感图像分类模型，利用xgboost替代原来用来分类的全连接层进行分类，提升了网络的分类性能。
28.二、本发明在mobilevit模型中加入了辅助分类器和通道、空间注意力机制,以加强对浅层、中层、深层特征信息的提取。
29.三、利用xgboost特征选择方法将浅层、中间层、深层特征信息中评分较高的特征提取出来进行特征降维，提高模型的效率。
30.四、mobilevit和xgboost均由粒子群智能优化算法同时优化。一方面，优化mobilevit提取的浅层、中间层、深层特征个数，使提取的特征更适合决策树xgboost，另一方面，优化xgboost使模型的结构与提取的特征相匹配，从而更好地理解图像特征。双向优化在保持两部分自身特征的同时让两部分结合得更紧密，提高遥感图像分类准确率。
31.五、通过与先进网络的一系列实验对比，证实了本发明的有效性，在准确率、精确度、召回率等各项评判指标中均高于其它网络，可以优先应用于遥感图像分类任务中。
附图说明
32.图1是本发明实施例基于xgboost改进的多尺度特征融合遥感图像分类模型的流程示意图。
33.图2是实施例中rsscn7数据集样本示意图。
34.图3是实施例中辅助分类器的结构
35.图4是实施例中去除辅助分类器后提取多尺度特征的结构示意图
36.图5是实施例中粒子群智能优化算法流程图
37.图6是实施例xmv-net网络模型结构示意图。
38.图7是实施例的混淆矩阵，其中(a)是xmv-net在rsscn7数据集的混淆矩阵,(b)是xmv-net在ucm数据集的混淆矩阵
具体实施方式
39.下面结合附图详细说明本发明的实施例。
40.实施例
41.遥感图像分类网络模型：英文简称xmv-net，是基于xgboost改进的多尺度特征融合遥感图像分类模型，从原始遥感图像数据集中提取多尺度关键特征属性，采用粒子群算法优化xgboost模型参数并实现特征降维，利用训练好的模型实现遥感图像分类，参阅图1，具体的方法流程为：
42.1、数据集的选取和预处理
43.选择来自2015年武汉大学所发布的遥感影像数据集rsscn7 data set。该数据集作为遥感图像场景分类的常用数据集之一,包含了来自7个典型的场景类别——草地、田野、工业、河湖、森林、居民、停车场。参阅图2，该数据集中每张图像的像素值大小为400
×
400,每个类别有400张图像,分别基于4个不同的尺度进行采样,共有2800张。这些图像来源于不同季节和天气变化,并以不同的比例进行采样,场景图像的多样性导致其具有较大的挑战性。
44.数据集ucm土地利用数据集由2100张图像组成，这些图像分为21个典型的土地利用场景类别：农业、飞机、棒球场、海滩、建筑物、丛林、密集住宅、森林、高速公路、高尔夫球场、港口、十字路口、中型住宅、移动房屋公园、立交桥、停车场、河流、跑道、稀疏住宅、储罐
和网球场。每个类别包含100个256
×
256像素的光学图像。
45.为了增强有关信息的可检测性和最大限度地简化数据,我们对数据进行了一系列数据增强处理。首先通过随机裁剪将图片大小固定为256
×
256,再进行随机水平旋转,然后进行归一化处理等操作。通过数据增强提高模型的泛化能力,增加噪声数据,提升了模型的鲁棒性。
46.2、样本数据集划分及训练mobilevit模型
47.将样本数据集x及其标签y按照4:1的比例划分为训练样本集和测试样本集.
48.mobilevit模型作为本方法的特征提取器，在训练过程中为了增强提取的浅层、中层、深层特征加入了通道空间注意力机制和辅助分类器,参阅图3。
49.在实验过程中,我们采用了adamw作为优化器,初始学习率设置为0.0001,权重衰减系数(weight decay)设置为0.05,该优化算法正确实现了权重衰减以及具有收敛速度快的特点。损失函数采用交叉熵损失函数,训练集和测试集的批尺寸(batch size)设置为12,每组实验训练批次(epoch)设置为400。
50.3、利用训练好的mobilevit提取图片特征
51.训练好的mobilevit用于提取特征时，去除辅助分类器,参阅图4，在通道空间注意力机制后将浅层、中层、深层特征进行全局平均池化，得到多尺度图片特征。
52.4、将训练集图片提取的特征值存入excel表格
53.由于在数据预处理中对训练集图片进行的数据增强是随机的，为了方便后续对实验进行验证，及粒子群智能优化算法对参数进行优化，需要将训练集图片提取的特征值存入excel表格。
54.5、xgboost特征重要性选择
55.因为特征本身存在重要性程度不同，筛选出重要特征对于减少计算量和提高计算速度有非常大的帮助，xgboost可以根据公式(1)计算特征的重要性得分用于提取特征，将不同层次的重要特征提取出来并组合成一个新数据集有利于xgboost进行分类。
[0056][0057]
式中gi为一阶导hi为二阶导γ，λ为用户自定义参数，通常，两个参数设置越大，模型结构越简单,i
l
和ir表示节点分裂后左右两边节点的样本集，i＝i
l
∪ir表示分裂前的节点的样本集。
[0058]
将样本数据集x及其标签y按照4:1的比例划分为训练样本集和测试样本集，利用训练样本集训练默认参数的xgboost模型，采用已训练好模型的feature_importances属性查看每个特征的重要性分数并按照特征重要性进行升序排序。挑选出特征重要性高的特征，组合成新数据集。
[0059]
6、粒子群智能优化算法寻找最优参数组合。
[0060]
虽然xgboost传统的默认参数设置的xgboost已广泛应用于许多领域，但没有参数优化的模型与现有数据集的拟合度较低，导致其泛化性能和适应性较差。同时不同层次的特征经过特征提取时，应选择的特征数量也对分类结果有很大影响。因此将xgboost的六个
重要参数和四个不同层次的特征数量组合(见表1)，利用粒子群智能优化算法进行迭代寻优，能使xgboost和mobilevit更加拟合，同时对特征进行降维处理，以得到更好的分类模型。
[0061]
粒子群智能优化算法流程图，参阅图5。粒子在迭代过程中通过跟踪个体最优位置(pbest)和全局最优位置(gbest)更新自己。粒子更新自己的位置的表达式可表示为:
[0062][0063][0064]
式中：t是迭代次数,v
id
是粒子i在第d维度的速度；c1和c2为加速常数,x
id
是第i个粒子位置向量的第d维,ω为惯性权重,rand(0,1)是值为大于0且小于1的随机数p
id
、g
id
分别是第i个粒子的个体最优位置、全局最优位置。
[0065]
7、训练xgboost模型并与mobilevit相结合生成最终模型，参阅图6。
[0066]
8、评估指标说明
[0067]
我们采用了计算机图像分类任务中常用的评估标准,即采用准确率(accuracy)、精确率(precision)、召回率(recall)、特异性(specifity)、f1-score作为模型的评判标准,计算公式如下所示：
[0068][0069][0070][0071][0072][0073]
式中：t
p
表示真阳性,即样本的真实类别是正例,并且模型预测的结果也是正例,tn表示真阴性,f
p
表示假阳性,fn表示假阴性。
[0074]
表1参数搜索空间
[0075][0076]
9、实验结果
[0077]
xgboost中六个参数和四个不同层次的特征数量的默认值见表2。本模型将十个参
数同时使用pso进行优化，优化后的参数值如表3所示。为了验证xmv-net网络在解决遥感图像场景分类任务中的有效性,我们在相同数据集以及相同环境配置下,进行了对比实验。在计算机视觉领域一直由卷积神经网络(cnn)主导，由于其强大的特征提取能力，在遥感图像场景分类领域cnn已达到最高水准。因此，本文设置的对照组包含了cnn架构中较为经典的网络结构，如googlenet、resnet50，以及近两年来最为火热的efficientnetv2、convnext，还包含了transformer架构中具有突出贡献的swin-transformer，以及吸收了卷积和自注意力机制优势的van、mobilevit。
[0078]
实验中,我们通过加权平均求和的方法求得各网络的评判结果如表4所示。相对而言,xmv-net在各评判指标中都获得了最好的效果,意味着我们的网络分类器对数据集中相关实例的识别能力最强,表现最为突出。这说明本发明网络在结合了xgboost和mobilevit二者架构优势之后，达到了比原网络架构更好的分类效果，在全局信息和局部信息的利用上有着较强的提升，综上所述,我们的网络在分类性能上显著优于其它网络,具有高准确性的特点。
[0079]
图7显示了xmv-net在rsscn7测试集上的混淆矩阵。由图可见,本文方法在该数据集上的每一类场景分类效果均在95％以上。证明本文方法对该数据集不同类别的场景数据有着很好的分辨能力。表2 xgboost六个参数信息和四个不同层次的特征数量
[0080]
[0081]
表3 pso优化后的参数值
[0082][0082][0083]
表4xmv-net与经典网络的在rsscn7、ucm数据集实验结果对比(％)
[0084][0085]
以上实施例对本发明提出的一种基于xgboost的多尺度特征融合遥感图像分类模型的具体实施方式进行了详细介绍，以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，
均包含在本发明的保护范围内。

技术特征：
1.一种基于xgboost的多尺度特征融合遥感图像分类模型包括步骤：(1)对原始数据集rsscn7、ucm数据集进行预处理得到样本数据集；(2)训练new-mobilevit网络。本发明在mobilevit网络中加入了通道空间注意力机制和辅助分类器,形成new-mobilevit网络以用于遥感图像的多尺度特征提取；(3)利用训练好的mobilevit提取图片特征。训练好的mobilevit用于提取特征时，去除辅助分类器，在通道空间注意力机制后将浅层、中层、深层特征进行全局平均池化，提取多尺度图片特征；(4)将训练集图片提取的多尺度特征值存入excel表格；(5)利用xgboost特征选择将浅层、中间层和深层特征信息根据特征重要程度进行倒序排序；(6)将xgboost的六个重要参数和四个不同尺度特征的特征维度组合，利用粒子群智能优化算法进行迭代寻优；(7)使用优化后的xgboost模型对特征选择后的多尺度信息进行分类生成最终模型。2.根据权利要求1所述的一种基于xgboost的多尺度特征融合遥感图像分类模型，其特征在于，步骤(2)中对mobilevit模型进行了改进，在mobilevit中加入了通道空间注意力机制和特定的辅助分类器块，通过辅助分类器,保留了浅层网络提取的特征,并加强了网络的收敛能力，四个loss值输出的加权系数依次为0.3、0.3、0.3、1.0,网络中loss值的计算公式如下所示：loss＝loss0+loss1*0.3+loss2*0.3+loss2*0.3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)。3.根据权利要求1所述的一种基于xgboost的多尺度特征融合遥感图像分类模型，其特征在于，步骤(2)中预设的辅助分类器由全局平均池化层、1
×
1卷积层、两个全连接层以及两个dropout层组成。4.根据权利要求1所述的一种基于xgboost的多尺度特征融合遥感图像分类模型，其特征在于，步骤(4)中由于数据增强是随机的，将提取的不同尺度特征存入excel表格，保证后述步骤中粒子群智能优化算法在同一数据环境中进行，方便后续对实验进行验证。5.根据权利要求1所述的一种基于xgboost的多尺度特征融合遥感图像分类模型，其特征在于，步骤(5)中特征本身存在重要性程度不同，筛选出重要特征对于减少计算量和提高计算速度有非常大的帮助，xgboost可以根据特征的重要性得分用于提取特征，将不同尺度的重要特征提取出来并组合成一个新数据集有利于xgboost进行分类。6.根据权利要求1所述的一种基于xgboost的多尺度特征融合遥感图像分类模型，其特征在于，步骤(6)中，采用粒子群优化算法优化mobilevit提取浅层、中间层、深层特征个数，进行特征降维的作用，同时使提取的特征更适合决策树xgboost，同时优化xgboost模型参数使模型的结构与提取的特征相匹配，从而更好地理解图像特征。双向优化在保持两部分自身特征的同时，让两部分结合得更紧密。
7.根据权利要求1所述的一种基于xgboost的多尺度特征融合遥感图像分类模型，其特征在于，步骤(7)中改进了mobilevit模型，传统的mobilevit仅通过全连接层构建的单层分类器容易受到图像噪声的干扰，从而导致分类精度降低，因此本文采用高精度的集成模型xgboost替代它的全连接层。为了进一步提高xmv-net模型的性能，本发明首先在mobilevit的中层添加辅助分类器和通道空间注意力机制来提取图像浅层和中层的特征，其次应用粒子群智能优化算法优化特征个数并采用xgboost对所提取的高维特征进行降维。此外，本发明还利用粒子群优化算法对xgboost的参数进行调整，提高了xmv-net的分类精度。

技术总结
本发明提出了一种新的基于XGBoost的多尺度特征融合遥感图像分类模型——XMV-Net。传统的MobileVit仅通过全连接层构建的单层分类器容易受到图像噪声的干扰，从而导致分类精度降低，因此本发明采用高精度的集成模型XGBoost替代它的全连接层。为了进一步提高模型性能，首先在MobileVit网络中加入辅助分类器，以及通道、空间注意力机制，形成New-MobileVit网络以用于遥感图像的多尺度特征提取；然后使用粒子群算法对多尺度特征信息维度以及XGBoost六个基本参数进行优化；最后使用优化后的XGBoost模型对特征选择后的多尺度信息进行分类。基于遥感数据集RSSCN7、UCM进行仿真实验，实验结果及相关讨论表明，与其他深度学习网络如Googlenet、Swin-Transformer等相比，XMV-Net在准确度、准确率等主要性能评估指标上均优于上述比较模型。标上均优于上述比较模型。标上均优于上述比较模型。

技术研发人员：赵俊豪徐蔚鸿
受保护的技术使用者：长沙理工大学
技术研发日：2022.07.05
技术公布日：2022/11/1

转载请注明原文地址: https://tieba.8miu.com/read-5613.html

专利

最新回复(0)