1.本技术实施例涉及域泛化学习领域,具体而言,涉及一种基于多元神经平均的域泛化学习方法、装置、设备及介质。
背景技术:2.域泛化学习的目的在于通过调整对源域数据的学习策略提升智能体在目标域上的泛化能力,由于域泛化学习任务假设目标域数据与源域数据类似而非同分布,使得其在医疗、智能驾驶、多模态学习等数据受限的机器学习应用场景下得到广泛应用。
3.然而,当前的域泛化学习普遍假设训练阶段可到达的有效假设空间中存在一个在源域和目标域上同时具有良好泛化能力的智能体,而忽视了当前以深度学习为代表的机器学习方法在源域上的记忆效应和过拟合趋势,导致现有的域泛化方法存在模型错误设置风险。此外,现有技术中消除源域间分布差异或风险差异的方法无法适应单源域泛化的现实需求。
技术实现要素:4.本技术实施例在于提供一种基于多元神经平均的域泛化学习方法、装置、设备及介质,旨在解决现有技术中存在的模型错误设置的风险以及无法兼容多源域与单源域情境的问题。
5.本技术实施例第一方面提供一种基于多元神经平均的域泛化学习方法,包括:
6.通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界;
7.通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,得到全局优化集成智能体,向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。
8.可选地,通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界,包括:
9.将源域中的源域样本输入所述神经网络;
10.对所述神经网络进行所述横向采样得到集成智能体,对所述神经网络进行所述径向采样得到集成神经平均;
11.将所述集成智能体和所述集成神经平均输入所述精简jensen-shannon散度损失函数和所述集成智能体多元化度量,得到估计的目标域泛化风险上界;
12.对所述估计的目标域泛化风险上界进行优化,得到所述优化后的目标域泛化风险上界。
13.可选地,对所述神经网络进行所述横向采样得到集成智能体,具体为:
14.利用dropout变分族对所述神经网络的参数进行横向采样,将所述dropout变分关闭,得到关于所述dropout变分族的集成,作为所述集成智能体。
15.可选地,对所述神经网络进行所述径向采样得到集成神经平均,具体为:
16.在所述神经网络优化轨迹上进行径向采样,采用滑动平均,得到神经平均集成。
17.可选地,所述精简jensen-shannon散度损失函数,用于优化源域的经验风险,定义为:
[0018][0019]
其中,(x,y)为样本实例,h为深度神经网络诱导的假设空间h上的一个智能体,a为所述样本实例(x,y)取样分布的支撑集,h
*
为智能体输出向量中指示真实类别维度的向量成分,h
*
∈(0,1),1
{
·
}
为示性函数。
[0020]
可选地,所述集成智能体多元化度量,用于显示鼓励所述横向采样的多元化,定义为:
[0021][0022]
其中,ρ为一个深度神经网络诱导的假设空间h上的一个集成智能体,p为一个任意测度,e
p
为所述测度p的期望,var(
·
)为取方差,l
pjs
为所述精简jensen-shannon散度损失函数。
[0023]
可选地,所述目标域泛化风险上界,定义为:
[0024][0025]
其中,h为深度神经网络诱导的假设空间h上的一个智能体,p为所述源域,q为所述目标域,为所述智能体ρ关于所述精简jensen-shannon散度损失函数l
pjs
在所述目标域q上的泛化风险,为智能体h关于精简jensen-shannon散度损失函数l
pjs
在数据域p上的泛化风险,d
js
(p||q)为所述源域p与所述目标域q间的jensen-shannon散度。
[0026]
本技术实施例第二方面提供一种基于多元神经平均的域泛化学习装置,包括:
[0027]
训练模块,用于通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界。
[0028]
测试模块,用于通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,得到全局优化集成智能体,向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。
[0029]
其中,训练模块还包括:
[0030]
输入子模块,用于将源域中的源域样本输入所述神经网络。
[0031]
采样子模块,用于对所述神经网络进行所述横向采样得到集成智能体,对所述神经网络进行所述径向采样得到集成神经平均。
[0032]
估计子模块,用于将所述集成智能体和所述集成神经平均输入所述精简jensen-shannon散度损失函数和所述集成智能体多元化度量,得到估计的目标域泛化风险上界。
[0033]
优化子模块,用于对所述估计的目标域泛化风险上界进行优化,得到所述优化后的目标域泛化风险上界。
[0034]
测试模块还包括:
[0035]
生成子模块,用于通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,生成全局优化集成智能体。
[0036]
测试子模块,用于向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。
[0037]
本技术实施例第三方面提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现基于多元神经平均的域泛化学习方法中的步骤。
[0038]
本技术实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现基于多元神经平均的域泛化学习方法中的步骤。
[0039]
有益效果:
[0040]
本技术提供一种基于多元神经平均的域泛化学习方法、装置、设备及介质,通过提出一种具有理论保证的适应单源域数据的基于多元神经平均的域泛化学习方法,通过快速集成智能体的方式实现在不增添学习参数的同时对有效假设空间进行扩充,具有以下优点:
[0041]
(1)同时在理论上和实践上考虑结合域泛化学习和集成学习,并首次提出了一种适用于域泛化学习的原则性集成智能体多元化度量,弱化了域泛化学习对有效假设空间存在理智能体的强假设,降低了模型错误设置风险。
[0042]
(2)通过在横向和径向上对智能体进行多元化优化和采样,扩充了有效假设空间,并通过集成稳定了优化过程,提升了智能体在非同分布情景下在目标域数据上的泛化性能。
[0043]
(3)本技术所提供的方法中,目标域风险泛化上界兼容多源域与单源域情境,适应单源域泛化的现实需求。
[0044]
(4)本技术所提供的方法中,在神经网络径向采样过程中无需多次训练,具有快速集成能力,计算开销更小,具有更好的大规模可拓展性。
附图说明
[0045]
为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0046]
图1是本技术一实施例提出的基于多元神经平均的域泛化学习方法流程图;
[0047]
图2是本技术一实施例提出的训练阶段流程示意图;
[0048]
图3是本技术一实施例提出的测试阶段流程示意图;
[0049]
图4是本技术一实施例提出的基于多元神经平均的域泛化学习装置示意图。
具体实施方式
[0050]
下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0051]
相关技术中,域泛化学习普遍假设训练阶段可到达的有效假设空间中存在一个在源域和目标域上同时具有良好泛化能力的智能体,而忽视了当前以深度学习为代表的机器学习方法在源域上的记忆效应和过拟合趋势,导致现有的域泛化方法存在模型错误设置风险。此外,现有技术中消除源域间分布差异或风险差异的方法无法适应单源域泛化的现实需求。
[0052]
有鉴于此,本技术实施例提出一种基于多元神经平均的域泛化学习方法、装置、设备及介质,通过提出一种具有理论保证的适应单源域数据的基于多元神经平均的域泛化学习方法,通过快速集成智能体的方式实现在不增添学习参数的同时对有效假设空间进行扩充,可以解决现有技术中存在的模型错误设置的风险以及无法兼容多源域与单源域情境的问题。
[0053]
本技术实施例提供的基于多元神经平均的域泛化学习方法,可以应用于测试目标域与源域数据不同时,通过本技术提供的基于多元神经平均的域泛化学习方法,可以将源域数据的样本训练得到的全局优化集成智能体,更好的用于目标域样本,输出对应目标域样本的预测值,完成数据的有效迁移。例如,本技术提供的方法可以应用于医疗领域,目标域病人群体的数据与训练阶段的源域病人群体的数据中存在不同(如年龄、种族、性别),利用本技术提供的方法,将该目标域病人群体的数据作为样本进行训练,得到的全局优化病人群体的集成智能体就可以有效处理目标域的病人群体数据。
[0054]
第一方面,本技术实施例提供了一种基于多元神经平均的域泛化学习方法,图1示出了基于多元神经平均的域泛化学习方法的流程图,如图1所示,包括如下两个阶段:
[0055]
s101、训练阶段。
[0056]
在训练阶段,对目标域泛化风险上界进行估计和优化,其中的估计过程和优化过程迭代进行。
[0057]
图2示出了训练阶段流程示意图,如图2所示,训练阶段按照如下步骤进行:
[0058]
s101-1、将源域中的源域样本输入神经网络。
[0059]
具体实施时,将源域中的源域样本实例(x,y)输入神经网络,该神经网络属于深度神经网络诱导的假设空间h的一个智能体h。
[0060]
s101-2、对神经网络进行横向采样得到集成智能体,同时对神经网络进行径向采样得到集成神经平均。
[0061]
具体实施时,对神经网络利用dropout变分族对神经网络的参数θ进行横向采样得到多个智能体,将dropout变分关闭,得到关于dropout变分族的集成,作为集成智能体h
θ
。
[0062]
与此同时,对神经网络的参数θ在优化轨迹上进行径向采样,通过滑动平均得到进而由神经网络的网络结构作用得到集成神经平均现有技术中基于慢集成学习的域泛化方法,在径向优化轨迹采样过程中,会对神经网络进行多次训练,集成速度较慢,且会导致计算开销庞大。本技术采用径向在优化轨迹上滑动平均,算法再一次优化过程中对
神经网络的参数进行滑动平均,近似得到多元化集成智能体,在保证了计算精确度的同时,提升了集成速度,降低了计算成本。
[0063]
s101-3、基于精简jensen-shannon散度损失函数和集成智能体多元化度量,得到估计的目标域泛化风险上界。
[0064]
将所述集成智能体h
θ
和所述集成神经平均输入所述精简jensen-shannon散度损失函数和所述集成智能体多元化度量。
[0065]
精简jensen-shannon散度损失函数用于优化源域经验风险,定义为:
[0066][0067]
其中,(x,y)为样本实例,h为深度神经网络诱导的假设空间h上的一个智能体,a为所述样本实例(x,y)取样分布的支撑集,h
*
为智能体输出向量中指示真实类别维度的向量成分,h
*
∈(0,1),1
{
·
}
为示性函数。
[0068]
精简jensen-shannon散度损失函数可以有效建立起风险函数和一种精简的jensen-shannon散度间的联系。与原始的jensen-shannon散度损失函数类似,该精简jensen-shannon散度损失函数满足平方根风险的三角不等式;不同的是,精简jensen-shannon散度损失函数相比于原始jensen-shannon散度损失函数,其对应的风险函数在以智能体为变量时是凸函数。因此,该精简jensen-shannon散度损失函数同时满足三角函数和凸性,可以证明集成智能体的目标域平方根泛化风险上界被不同的智能体平均平方根泛化风险限定。
[0069]
集成智能体多元化度量用于显示鼓励dropout变分族的横向采样多元化,定义为:
[0070][0071]
其中,ρ为一个深度神经网络诱导的假设空间h上的一个集成智能体,p为一个任意测度,e
p
为所述测度p的期望,var(
·
)为取方差,l
pjs
为所述精简jensen-shannon散度损失函数。
[0072]
对于集成智能体多元化度量,有如下不等式成立:
[0073][0074]
其中,为智能体h关于精简jensen-shannon散度损失函数l
pjs
在数据域p上的泛化风险。
[0075]
在不同智能体的平均平方根泛化风险的基础上,引入该集成智能体多元化度量,进一步证明集成智能体的目标域平方根泛化风险上界可以被进一步缩紧。
[0076]
对于dropout变分族的集成中每一个实例,对集成智能体多元化度量进行显示优化;对与集成神经平均中的每个实例,对集成智能体多元化度量进行隐式补偿,并基于精简jensen-shannon散度损失函数优化得到的泛化经验风险,得到估计的目标域泛化风险上界。
[0077]
得到的估计的目标域泛化风险上界,兼容多源域与单源域情景,适应单源域泛化的现实需求,该目标域泛化风险上界,定义为:
[0078][0079]
其中,h为深度神经网络诱导的假设空间h上的一个智能体,p为所述源域,q为所述目标域,为所述智能体ρ关于所述精简jensen-shannon散度损失函数l
pjs
在所述目标域q上的泛化风险,为智能体h关于精简jensen-shannon散度损失函数l
pjs
在数据域p上的泛化风险,d
js
(p||q)为所述源域p与所述目标域q间的jensen-shannon散度。对于固定的源域p和目标域q,该散度为固定值。
[0080]
s101-4、对估计的目标域泛化风险上界进行优化,得到优化后的目标域泛化风险上界。
[0081]
对上述得到的估计的目标域泛化风险上界,使用梯度下降方法对其进行优化,当收敛后,得到优化后的目标域泛化风险上界。
[0082]
s102、测试阶段。
[0083]
在测试阶段,基于训练阶段得到的目标域泛化风险上界,得到全局优化集成智能体利用该全局优化集成智能体对目标域样本x
t
进行处理,得到最终预测值
[0084]
图3示出了测试阶段流程示意图,如图3所示,测试阶段按照如下步骤进行:
[0085]
s102-1、关闭横向采样和所述径向采样,基于优化后的目标域泛化风险上界,得到全局优化集成智能体。
[0086]
具体实施时,在对目标域风险上界的优化结束后,通过关闭dropout和神经平均,基于优化后的目标域泛化风险上界,得到全局优化集成智能体全局优化集成智能体具有受控的目标域泛化风险上界。
[0087]
s102-2、向全局优化集成智能体输入目标域的目标域样本,得到最终预测值。
[0088]
将目标域中的目标域样本x
t
输入该具有受控目标域泛化风险上界的全局优化集成智能体得到该目标域样本对应的最终预测值
[0089]
示例性的,本技术实施例提供的基于多元神经平均的域泛化学习方法,应用于自动驾驶领域,源域中的天气分布数据与目标域中的天气分布数据不同,将源域中的天气分布数据作为样本基于上述基于多元神经平均的域泛化学习方法进行训练后,得到全局优化的天气分布集成智能体,可以有效处理目标域中的天气分布数据,输出所需的目标域天气分布数据对应的预测值。
[0090]
本技术实施例提供一种基于多元神经平均的域泛化学习方法,通过提出一种具有理论保证的适应单源域数据的基于多元神经平均的域泛化学习方法,通过快速集成智能体的方式实现在不增添学习参数的同时对有效假设空间进行扩充,具有以下优点:
[0091]
(1)同时在理论上和实践上考虑结合域泛化学习和集成学习,并首次提出了一种适用于域泛化学习的原则性集成智能体多元化度量,弱化了域泛化学习对有效假设空间存在理智能体的强假设,降低了模型错误设置风险。
[0092]
(2)通过在横向和径向上对智能体进行多元化优化和采样,扩充了有效假设空间,并通过集成稳定了优化过程,提升了智能体在非同分布情景下在目标域数据上的泛化性能。
[0093]
(3)本技术所提供的方法中,目标域风险泛化上界兼容多源域与单源域情境,适应单源域泛化的现实需求。
[0094]
(4)本技术所提供的方法中,在神经网络径向采样过程中无需多次训练,具有快速集成能力,计算开销更小,具有更好的大规模可拓展性。
[0095]
基于同一发明构思,本技术实施例提供了一种基于多元神经平均的域泛化学习装置,图4示出了基于多元神经平均的域泛化学习装置示意图,如图4所示,基于多元神经平均的域泛化学习装置包括:
[0096]
训练模块,用于通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界。
[0097]
测试模块,用于通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,得到全局优化集成智能体,向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。
[0098]
其中,训练模块还包括:
[0099]
输入子模块,用于将源域中的源域样本输入所述神经网络。
[0100]
采样子模块,用于对所述神经网络进行所述横向采样得到集成智能体,对所述神经网络进行所述径向采样得到集成神经平均。
[0101]
估计子模块,用于将所述集成智能体和所述集成神经平均输入所述精简jensen-shannon散度损失函数和所述集成智能体多元化度量,得到估计的目标域泛化风险上界。
[0102]
优化子模块,用于对所述估计的目标域泛化风险上界进行优化,得到所述优化后的目标域泛化风险上界。
[0103]
测试模块还包括:
[0104]
生成子模块,用于通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,生成全局优化集成智能体。
[0105]
测试子模块,用于向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。
[0106]
本技术实施例所提供的基于多元神经平均的域泛化学习装置可实现前述方法实施例的全部内容,因此,各个模块的具体功能实现可参考前述方法实施例,此处不再赘述。
[0107]
本技术实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现本技术实施例所提出的基于多元神经平均的域泛化学习方法中的步骤。
[0108]
本技术提供的又一实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时以实现本技术实施例所提出的基于多元神经平均的域泛化学习方法中的步骤。
[0109]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质
中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
[0110]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0111]
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0112]
以上所述仅为本技术的较佳实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本技术的保护范围内。
技术特征:1.一种基于多元神经平均的域泛化学习方法,其特征在于,包括:通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界;基于所述优化后的目标域泛化风险上界,得到全局优化集成智能体,向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。2.根据权利要求1中所述的基于多元神经平均的域泛化学习方法,其特征在于,通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界,包括:将源域中的源域样本输入所述神经网络;对所述神经网络进行所述横向采样得到集成智能体,对所述神经网络进行所述径向采样得到集成神经平均;将所述集成智能体和所述集成神经平均输入所述精简jensen-shannon散度损失函数和所述集成智能体多元化度量,得到估计的目标域泛化风险上界;对所述估计的目标域泛化风险上界进行优化,得到所述优化后的目标域泛化风险上界。3.根据权利要求2中所述的基于多元神经平均的域泛化学习方法,其特征在于,对所述神经网络进行所述横向采样得到集成智能体,具体为:利用dropout变分族对所述神经网络的参数进行横向采样,将所述dropout变分关闭,得到关于所述dropout变分族的集成,作为所述集成智能体。4.根据权利要求2中所述的基于多元神经平均的域泛化学习方法,其特征在于,对所述神经网络进行所述径向采样得到集成神经平均,具体为:在所述神经网络优化轨迹上进行径向采样,采用滑动平均,得到神经平均集成。5.根据权利要求2中所述的基于多元神经平均的域泛化学习方法,其特征在于,所述精简jensen-shannon散度损失函数,用于优化源域的经验风险,定义为:其中,(x,y)为样本实例,h为深度神经网络诱导的假设空间h上的一个智能体,a为所述样本实例(x,y)取样分布的支撑集,h
*
为智能体输出向量中指示真实类别维度的向量成分,h
*
∈(0,1),1
{
·
}
为示性函数。6.根据权利要求2中所述的基于多元神经平均的域泛化学习方法,其特征在于,所述集成智能体多元化度量,用于显示鼓励所述横向采样的多元化,定义为:其中,ρ为一个深度神经网络诱导的假设空间h上的一个集成智能体,p为一个任意测度,e
p
为所述测度p的期望,var(
·
)为取方差,l
pjs
为所述精简jensen-shannon散度损失函数。7.根据权利要求6中所述的基于多元神经平均的域泛化学习方法,其特征在于,所述目
标域泛化风险上界,定义为:其中,h为深度神经网络诱导的假设空间h上的一个智能体,p为所述源域,q为所述目标域,为所述智能体ρ关于所述精简jensen-shannon散度损失函数l
pjs
在所述目标域q上的泛化风险,为智能体h关于精简jensen-shannon散度损失函数l
pjs
在数据域p上的泛化风险,d
js
(p||q)为所述源域p与所述目标域q间的jensen-shannon散度。8.一种基于多元神经平均的域泛化学习装置,其特征在于,所述装置包括:训练模块,用于通过对神经网络进行横向采样和径向采样,并基于精简jensen-shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界;测试模块,用于通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,得到全局优化集成智能体,向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现权利要求1-7中任一所述的基于多元神经平均的域泛化学习方法中的步骤。10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-7中任一所述的基于多元神经平均的域泛化学习方法中的步骤。
技术总结本申请涉及域泛化学习领域,提供一种基于多元神经平均的域泛化学习方法、装置、设备及介质,包括:训练阶段,通过对神经网络进行横向采样和径向采样,并基于精简Jensen-Shannon散度损失函数和集成智能体多元化度量,对目标域泛化风险上界迭代进行估计和优化,得到优化后的目标域泛化风险上界;测试阶段,通过关闭所述横向采样和所述径向采样,基于所述优化后的目标域泛化风险上界,得到全局优化集成智能体,向所述全局优化集成智能体输入目标域的目标域样本,得到最终预测值。本申请旨在解决现有技术中存在的模型错误设置的风险以及无法兼容多源域与单源域情境的问题。兼容多源域与单源域情境的问题。兼容多源域与单源域情境的问题。
技术研发人员:朱文武 王鑫 初旭
受保护的技术使用者:清华大学
技术研发日:2022.07.15
技术公布日:2022/11/1