本发明属于三维表型参数拟合,涉及一种基于集成学习的树木最大冠幅处高度模拟预测方法。
背景技术:
1、最大冠幅处高度是树冠的冠幅位置对应的高度,对于一些针叶树可以将树冠分为上下两部分,是一个重要的树木三维表型参数。在森林中,由于树冠之间可能存在相互交叉重叠的情况,导致现有的一些表型采集手段,如激光雷达点云数据不能够容易的提取到最大冠幅处高度参数这类树冠的表型参数。而集成学习可以将若干基模型集成,对数据进行高精度的回归拟合。作为一个位于树冠上的高度参数,最大冠幅处高度和树高以及周围树造成的空间竞争之间存在直接关系,构建最大冠幅处高度和空间竞争之间的耦合模型是相关研究的一个重要方向。
技术实现思路
1、本发明针对现有技术问题,提供一种基于集成学习的树木最大冠幅处高度模拟预测方法。
2、一种基于集成学习的树木最大冠幅处高度模拟预测方法,含有以下步骤:
3、步骤1、模型构建所需数据采集,包括每株树的位置(x、y、z)、树高、胸径、单一方向最大冠幅处高度(东、西、南、北)、单一方向冠幅(东、西、南、北)。计算得到单一方向的垂直空间结构参数、水平空间结构参数(东、西、南、北)。
4、步骤2、基模型选择,按照回归拟合常用模型选择3类11种机器学习模型作为基模型。
5、(1)基于树模型:决策树、随机森林、梯度提升、自适应增强。
6、(2)梯度提升树变种模型:极端梯度提升、轻量梯度提升机、梯度提升决策树。
7、(3)线性模型:支持向量机、岭回归、套索算法、弹性网络回归。
8、步骤3、基模型优化与拟合,为了提高模拟精度,对基模型引入网格搜索交叉验证,进行超参数调优,并进行数据清洗、特征缩放操作,提高模型效果。计算评价指标。
9、步骤4、集成模型构建与拟合,选择目前常用的5种集成学习方法:装袋、提升、投票、堆叠、混合。对11种基模型按照排列组合的方式进行组合,每种集成学习方法分别对每个组合进行集成训练,计算评价指标。
10、步骤5、结果对比与最优模型选择,对比所有基模型和集成学习组合模型的拟合结果,对比评价指标,筛选最优的拟合模型。
11、本发明的优点是:实现方式简单有效,借助机器学习算法、集成学习方法,对东西南北不同方向的最大冠幅处高度进行模拟,解决了这一树木三维表型参数获取困难的问题,实现了以树木中容易采集到的高精度表型参数如树高、冠幅等,结合空间竞争等环境因子作为自变量模拟预测不易获得的表型参数。相比激光雷达提取,在林分密度较大的森林中,回归预测的方法更容易实现对最大冠幅处高度参数的获取。并且通过不同集成学习方法对于不同机器学习算法的组合,验证了最适合模拟最大冠幅处高度参数的模型组合,模拟结果精度可以满足相关研究以及林业应用需求。
1.一种基于集成学习的树木最大冠幅处高度模拟预测方法,其特征在于,含有以下步骤:
2.根据权利要求1所述的一种基于集成学习的树木最大冠幅处高度模拟预测方法,其特征在于,步骤1数据采集,含有以下步骤:由于考虑不同方向空间竞争对树木三维表型的影响不同,数据采集时和传统林业调查有所区别,划分了东西南北4个方向,针对每个方向通过测高仪分别测量该方向的最大冠幅处高度、树高,通过塔尺测量每个方向的冠幅,利用围尺测量每株树的胸径,并使用rtk采集每株树的位置坐标(x、y、z),通过采集到的数据计算处理得到每株树在东、西、南、北各个方向的垂直空间结构参数、水平空间结构参数,作为模型所需的特征值。
3.根据权利要求1所述的一种基于集成学习的树木最大冠幅处高度模拟预测方法,其特征在于,步骤2中的机器学习模型,含有以下步骤:最大冠幅处高度与空间竞争耦合基模型的选择与优化拟合,机器学习中很多算法都适合于数据的回归拟合,通过对使用机器学习进行回归拟合研究文献的筛选,按照回归拟合常用模型选择11种机器学习模型作为基模型,根据模型特性划分为3类,包括(1)基于树模型:决策树、随机森林、梯度提升、自适应增强,(2)梯度提升树变种模型:极端梯度提升、轻量梯度提升机、梯度提升决策树,(3)线性模型:支持向量机、岭回归、套索算法、弹性网络回归,为了提高拟合精度,对所有基模型引入网格搜索交叉验证进行超参数调优,并结合数据清洗、特征缩放操作,提高模型效果,通过超参数优化、数据清洗、特征缩放等操作减小数据的噪声,降低模型中的过拟合现象,提高对于最大冠幅处高度的拟合精度。
4.根据权利要求3所述的一种基于集成学习的树木最大冠幅处高度模拟预测方法,其特征在于,最大冠幅处高度与空间竞争耦合集成模型构建与拟合,还含有以下步骤:进一步提高模型的拟合精度,引入集成学习方法,对多个基模型进行集成,得到强学习器,获得更好的拟合效果,选择目前常用的5种集成学习方法:装袋、提升、投票、堆叠、混合,
5.根据权利要求1所述的一种基于集成学习的树木最大冠幅处高度模拟预测方法,其特征在于,步骤5中结果对比与最优模型选择,还含有以下步骤:通过权利要求3和权利要求4,得到单一模型和组合模型的拟合结果以及各个模型的精度评价指标,选择了6个指标:决定系数(r2)、均方根误差(rmse)、平均绝对误差(mae)、平均绝对百分比误差(mape)、解释方差评分(evs)、中位数绝对误差(median-ae)作为评价标准,以r2和rmse作为主要评价指标,其他作为辅助参考指标,对比所有评价结果,筛选精度最优的模型作为最大冠幅处高度拟合模型,应用于最大冠幅处高度的模拟预测。
