本发明涉及人工智能的,尤其涉及一种基于超参数智能寻优的感知模型自推荐方法,以及基于超参数智能寻优的感知模型自推荐装置。
背景技术:
1、在当今的ai技术领域,深度学习模型已广泛应用于图像识别、语音处理、自然语言理解等多个方面,其中感知模型作为核心组件,在目标检测、语义分割、场景理解等任务中发挥着至关重要的作用。随着数据规模的增长和应用场景的多样化,如何高效地优化这些模型的超参数,以达到最佳性能表现,成为了一个亟待解决的关键问题。超参数优化是一个资源密集型过程,传统方法如网格搜索、随机搜索不仅耗时长,而且效率低下,难以应对大规模模型和复杂任务的需求。
2、近年来,强化学习作为一种自适应策略搜索方法,在超参数优化领域展现出巨大潜力。尤其是深度强化学习(drl)技术,通过构建智能体与环境交互的学习框架,能够自动探索优化空间,寻找最优配置。proximal policy optimization(ppo)算法作为drl中的代表,因其稳健性和高效性,被广泛应用于超参数调优任务中。例如,陈森朋等人在《基于强化学习的超参数优化方法》中通过设计lstm的策略网络,实现对随机森林和xgboost算法的超参数优化;刘云浩在《基于强化学习的机器学习流水线超参数优化研究》中对于多个机器学习算法同时存在造成的超参数配置维度过大的问题,通过将流水线的超参数优化建模为多智能体协作问题,来降低每个智能体的动作维度。然而,这些工作主要集中在复杂度较低的机器学习算法,对于特定于感知深度学习模型的超参数优化,尤其是在实际部署中的自动化和效率提升方面,仍存在一定的局限性。当前多数研究倾向于使用循环神经网络(如lstm)来建模策略,尽管lstm能有效处理序列数据,但在处理大规模并行计算和长序列时,其计算效率较低,无法并行计算,限制了超参数优化的速度和规模。此外,现有技术大多依赖于完整训练感知模型至收敛来评估超参数设置的效果,这导致优化过程极为耗时。这种方法在面对超参数空间的高维度和复杂性时显得尤为低效。
3、尽管深度强化学习在超参数优化上取得了进展,但针对感知模型的高效、自动化的超参数寻优技术仍面临策略网络计算效率低下以及评估成本高昂的挑战。因此,开发一种既能提高优化效率,又能保持优化质量的新技术方案,对于促进感知类深度学习模型在实际应用中的快速迭代和性能提升具有重要意义。
技术实现思路
1、为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于超参数智能寻优的感知模型自推荐方法,其大大提升了超参数优化过程中的计算效率与吞吐量,允许模型在大规模数据集和复杂任务中快速迭代,降低了对计算资源的依赖,从而满足了现代ai系统对于高效能和快速响应的需求,显著加速了超参数搜索进程,减少了实际训练开销,使得优化过程更加灵活经济,有助于在有限的时间和资源下探索更广阔的超参数空间。
2、本发明的技术方案是:这种基于超参数智能寻优的感知模型自推荐方法,包括以下步骤:
3、(1)设计基于transformer编码器的策略网络,transformer编码器由多个编码器层堆叠而成,每个编码器层包含两个子层:多头自注意力机制和前馈神经网络;在每个编码器层内,多头自注意力机制用于捕捉序列中不同位置之间的依赖关系,前馈神经网络负责非线性变换和特征提取;每个子层后面都紧跟残差连接和层归一化,以确保梯度的稳定传递和模型的高效训练;
4、策略网络基于transformer编码器结构进行设计,首先将超参数空间中的候选点进行编码,形成序列化的输入表示,每个超参数作为一个向量表示,这些向量通过线性变换和位置编码处理后,输入到transformer编码器中;位置编码在不引入循环或卷积结构的情况下注入位置信息,使模型能够识别序列中各个位置的关系;输入序列经过多个编码器层的处理,转化为高维特征表示;多头自注意力机制确保超参数之间的相互依赖关系被有效捕捉,前馈神经网络进一步提取和变换特征,使得最终的特征表示包含丰富的上下文信息;然后,编码器的输出经过全连接层和softmax激活函数,生成策略分布;
5、(2)构建目标性能预测模型,目标性能预测模型采用全连接神经网络架构;
6、(3)采用近端策略优化ppo进行超参数优化,包括:状态表示、动作生成、策略更新、奖励计算和模型预测。
7、本发明结合了深度强化学习和transformer编码器的优势,带来了显著的有益效果。通过采用基于transformer编码器的策略网络,相较于传统的lstm结构,实现了策略网络的并行推理能力。这一改进大大提升了超参数优化过程中的计算效率与吞吐量。transformer编码器利用自注意力机制和并行计算架构,能够同时处理多个超参数配置的特征向量,从而加快策略网络的推理速度。这一设计不仅满足了现代ai系统对于高效能和快速响应的需求,还有效地支持了大规模超参数搜索任务的执行,提升了整体优化效率。本发明通过训练一个能够精准预测感知模型优化目标值的模型,解决了超参数评估周期长的问题。传统方法在每次调整超参数后都需要进行完整的模型训练和验证,这一过程耗时耗力,极大地限制了超参数优化的效率。通过引入目标性能预测模型,本发明能够在每次超参数配置生成后,快速预测感知模型的性能指标,从而减少了频繁执行全量模型训练的需求。这一改进不仅加速了超参数优化进程,还减少了实际训练开销,使得整个优化过程更加灵活和经济。在有限的时间和资源下,优化系统能够探索更广阔的超参数空间,进而发现更优的超参数配置,显著提升了感知模型的性能。
8、还提供了基于超参数智能寻优的感知模型自推荐装置,其包括:
9、策略网络设计模块,其配置来设计基于transformer编码器的策略网络,transformer编码器由多个编码器层堆叠而成,每个编码器层包含两个子层:多头自注意力机制和前馈神经网络;在每个编码器层内,多头自注意力机制用于捕捉序列中不同位置之间的依赖关
10、系,前馈神经网络负责非线性变换和特征提取;每个子层后面都紧跟残差连接和层归一化,以确保梯度的稳定传递和模型的高效训练;
11、策略网络基于transformer编码器结构进行设计,首先将超参数空间中的候选点进行编码,形成序列化的输入表示,每个超参数作为一个向量表示,这些向量通过线性变换和位置编码处理后,输入到transformer编码器中;位置编码在不引入循环或卷积结构的情况下注入位置信息,使模型能够识别序列中各个位置的关系;输入序列经过多个编码器层的处理,转化为高维特征表示;多头自注意力机制确保超参数之间的相互依赖关系被有效捕捉,前馈神经网络进一步提取和变换特征,使得最终的特征表示包含丰富的上下文信息;
12、然后,编码器的输出经过全连接层和softmax激活函数,生成策略分布;
13、目标性能预测模型构建模块,其配置来构建目标性能预测模型,目标性能预测模型采用全连接神经网络架构;
14、超参数优化模块,其配置来采用近端策略优化ppo进行超参数优化,包括:状态表示、动作生成、策略更新、奖励计算和模型预测。
1.基于超参数智能寻优的感知模型自推荐方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(1)中,多头自注意力机制包括:首先,输入序列经过线性变换生成查询向量query、键向量key和值向量value;然后,计算查询向量与键向量的点积,并通过softmax函数归一化,得到注意力权重;最后,将注意力权重与值向量相乘,得到加权后的输出表示。
3.根据权利要求2所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(1)中,在每个编码器层中,自注意力机制的输出通过一个位置独立的前馈神经网络进行处理,该网络由两个线性变换和一个relu激活函数组成。
4.根据权利要求3所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(1)中,残差连接通过将子层输入直接添加到输出,形成短连接路径,层归一化对每个子层的输出进行标准化处理。
5.根据权利要求4所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(2)中,输入表示方面,采用基于特征工程的编码方式,将超参数空间中的候选点转化为向量表示,对于每个超参数,首先定义其取值范围和步长,然后将取值进行归一化处理,映射到[0,1]区间内;对于离散型超参数,采用独热编码方式,将其转化为高维稀疏向量;对于连续型超参数,采用线性变换方式,将其转化为低维密集向量。
6.根据权利要求5所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(2)中,位置编码方面,采用基于正余弦函数的位置编码方式,使模型识别序列中各个位置的关系,对于序列中的第i个位置,位置编码向量的第2j维和第2j+1维分别由正弦函数和余弦函数生成。
7.根据权利要求5所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(2)中,策略分布生成方面,采用基于全连接层和softmax激活函数的方式,编码器的输出首先经过一个全连接层,将高维特征映射到超参数空间的概率分布,全连接层的权重矩阵和偏置向量通过随机初始化,并在训练过程中不断更新,然后,经过softmax激活函数,将输出转化为概率分布。
8.根据权利要求5所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(2)中,全连接神经网络包括:
9.根据权利要求5所述的基于超参数智能寻优的感知模型自推荐方法,其特征在于:所述步骤(3)中,
10.基于超参数智能寻优的感知模型自推荐装置,其特征在于:其包括:
