基于交互学习降低点击率预测中噪声标签影响的方法与流程

专利2022-12-30 347

1.本发明涉及人工智能在互联网营销的技术领域，更具体地，涉及一种基于交互学习降低点击率预测中噪声标签影响的方法。

背景技术：

2.点击率(click-through rate，简称ctr)预估问题是互联网计算广告中的关键环节；对用户预估的准确性直接影响公司营销广告的收入。点击率预估问题是互联网计算广告中的关键环节，对用户预估的准确性直接影响公司营销广告的收入。
3.在广告投放过程中，一般会经历广告曝光、用户点击和用户注册(或称转化)这三个过程，ctr预估的一大目的是提高从广告曝光到用户点击的效率，即提高点击率。由于用户点击或不点击一般定义为用户行为的标签。
4.本领域技术人员清楚，传统的ctr预估可看做是一个有监督学习问题：即已知了用户点击行为等一系列特征后，将用户点击记为1，用户不点击记为0，从而进行二分类学习。
5.在ctr预估中，通常将一段时间内投放广告后用户的点击行为收集作为训练样本集。从表面上看，用户点击或者不点击是用户的自发行为，并不存在很多监督学习任务中人工标注数据集导致的错误标注等问题。
6.然而，在实际业务中，广告投放后返回的标签并不一定是真实的。例如，对于金融保险类业务，很多时候可能是子女代父母操作完成相关的点击行为。那么理论上，父母具有的人物画像等特征(包括年龄、收入、职业等)与其实际是否点击并不相符。这样就在实际业务中引入了许多噪声标签，上述这些样本会导致模型产生过度自信的预测，其稳定性和鲁棒性都与真实情况不符。
7.目前，对于噪声标签的学习，比较有代表性方法包括了mentornet和decoupling。具体来说，mentornet预先训练一个额外的网络，然后使用这个网络选择干净的数据来指导训练。当干净的验证数据不可用时，mentornet必须使用预定义的课程(例如，自定进度的课程)。自定进度的mentornet的想法类似于自我训练，并且，它一样有因样本选择偏差引起累积误差的劣势。decoupling同时训练两个网络，然后，仅使用这两个网络预测不同的样本来更新模型。
8.尽管如此，噪声标签仍均匀分布在整个空间中，不一致区域包括许多噪声标签，decoupling方法不能明确地处理噪声标签。因此，业界急需发展更可靠的噪声标签学习技术，以满足提升ctr预估的鲁棒性，具有重要的理论和应用价值。

技术实现要素：

9.本发明的目的在于克服现有技术存在的上述缺陷，提供一种基于交互学习降低点击率预测中噪声标签影响的方法，其通过基于多模型交互学习逐步筛选出样本中的噪声数据，最终得到稳定性和鲁棒性都更高的预测用户点击的二分类学习器。
10.为实现上述目的，本发明的技术方案如下：
11.一种基于交互学习降低点击率预测中噪声标签影响的方法，
12.包括据预处理步骤s1、训练集的生成步骤s2和预测模型建立步骤s3；
13.所述数据预处理步骤s1包括如下步骤：
14.步骤s11：获取n个用户的原始信息，并从所述用户的原始信息提取原始特征信息；其中，所述原始特征信息包括用户id、用户手机号码归属地、任务批次号、用户访问dpi、用户访问dpi频次和/或用户是否点击特征；所述任务批次号表示一个日期时间段中用户的原始信息，所述用户访问dpi和用户访问dpi频次为每一个任务批次号为计量单位，所述n大于等于2；
15.步骤s12：依次处理具有所述任务批次号的所有批次中的所述原始特征信息，对所述用户的原始特征信息进行异常检测与处理步骤；
16.步骤s13：依次处理具有所述任务批次号的所有批次中的所述原始特征信息，通过独热编码对类别特征进行处理，并利用rankgauss方法对连续特征进行处理；
17.其中，依次按所述任务批次号将所有不同的用户访问dpi作为单独的特征展开，以及在所述任务批次号中将dpi访问频次也按照所有不同的用户访问dpi展开为用户访问dpi与dpi的频次的关系特征；
18.所述训练集的生成步骤s2包括：
19.s21：将所有所述任务批次号按照升序进行排序，得到所有所述任务批次号的排序；其中，所述任务批次号的升序是同日期时间的远近成正比，所述日期时间越近，所述任务批次号越大；
20.s22：选择所述任务批次号最大的任务批次中的数据作为验证集，剩余的所述任务批次号的数据作为训练集；
21.上述生成步骤完成后，就可以执行所述预测模型建立步骤s3，可以具体包括将所述新的训练集中的每一个样本对所述神经网络模型进行训练和验证，得到参数优化后的所述神经网络模型，并使用验证集进行验证，得到最终的预测网络模型。
22.所述预测模型建立步骤s3包括：
23.s31：建立学习器a、学习器b和学习器c，并将所述训练集数据随机打乱后选择m1％的所述训练集数据分为n个小批次批量数据(d1,d2…dn
)；其中，所述学习器a采用具有参数w_a的深度学习网络模型a，所述学习器b采用具有参数w_b的深度学习网络模型b，所述学习器c具有参数w_c的深度学习网络模型c；其中，所述深度学习网络模型c为待训练模型；
24.s32：依次选择n个小批次批量数据(d1,d2…dn
)对所述深度学习网络模型a和深度学习网络模型b进行训练，在每个所述批量数据中，所述深度学习网络模型a或深度学习网络模型b各自选择损失小的样本作为有用知识样本，并将所述有用知识样本传授给另一个深度学习网络模型以进行进一步的训练；
25.s33：将步骤s32所训练得到的深度学习网络模型a和深度学习网络模型b的参数加权相加得到参数w_c，并传递给具有参数w_c的深度学习网络模型c，完成剩余m2％数据的训练，得到最终参数优化后的深度学习网络模型c，并使用验证集进行验证，得到最终的预测网络模型，其中，m1+m2＝100。
26.进一步地，所述深度学习网络模型a、深度学习网络模型b和深度学习网络模型c的网络架构包括：
27.输入层，将原始数据随机打乱后选定一定大小的批次输入；
28.嵌入层，对所述输入层特征进行信息抽提和降维；
29.多通道自注意力层，接收降维后的特征，并进行特征的权重分配；
30.全连接层，接收所述多通道自注意力层的输出，进行全连接的网络训练；
31.输出层，对于点击的二分类问题，通过sigmoid函数即可输出预测的概率，通过划定阈值即可表示为0/1二分类，所述输出层添加一个神经元。
32.进一步地，所述s32包括：
33.步骤s321：获取一个小批量数据d输入模型时，在所述小批量数据d上选择一部分数据深度学习网络模型a，另一部分在深度学习网络模型b中进行训练；两个深度学习网络模型的样本的数量由参数r控制，所述参数r为选择的百分比；
34.步骤s322：深度学习网络模型a和深度学习网络模型b在训练中产生的损失函数记为loss_a和loss_b，接下来进行判断：若loss_a小于loss_b，则将深度学习网络模型a的损失回传给深度学习网络模型b；若loss_a大于loss_b，则将深度学习网络模型的损失函数回传给深度学习网络模型a，并通过损失函数的反向传播进行参数的更新，以通过两个网络自适应地校正另一个网络的训练错误；
35.步骤s323：重复步骤s321和s322，直到完成所有小批量数据d的数据训练。
36.进一步地，所述的方法还包括营销活动预测步骤s4，其具体包括：
37.步骤s41：获取拟对营销活动点击预测的用户群体和所述用户群体的用户原始信息，并从所述用户原始信息提取原始特征信息；其中，所述原始特征信息包括用户id、用户手机号码归属地、任务批次号、用户访问dpi、用户访问dpi频次和/或用户是否点击特征；
38.步骤s42：对每一个所述用户的原始信息进行异常检测与处理步骤；通过独热编码对类别特征进行处理，利用rankgauss方法对连续特征进行处理；
39.步骤s43：提供建立训练好的预测网络模型，依次使用从所述用户原始信息提取原始特征信，得到拟对营销活动点击预测的用户群体中所有所述用户的预测值；其中，所述用户的模型预测值为所述用户的点击意愿度。
40.进一步地，所述模型预测步骤s4还包括：
41.步骤s44：根据实际投放需求，选择全部或部分所述用户的模型预测值集中点击意愿度为1的用户进行精准营销的任务。
42.进一步地，所述步骤s3中还包括步骤s37，对所述基于交互学习降低广告点击率预测中噪声标签影响的预测方法模型的营销活动预测模型进行模型评价指标处理和调优处理；所述模型评价指标包括auc值、log loss值和相对信息增益rig值。
43.进一步地，所述模型调优处理包括如下一种或几种：
44.增加批归一化，解决数据的内部协变量偏移问题；
45.在网络中增加让部分神经元在训练过程中处于休眠状态的功能；
46.调整学习率，一般会通过指数式衰减等策略调整训练过程中的学习率；
47.设置多种子训练取平均，以提高由于数据方差较大引起的泛化能力不足的问题；
48.增加l1或者l2正则化，对损失函数施加惩罚，以降低过拟合风险；
49.对超参数的优化方法。
50.进一步地，所述m1:m2＝8:2。
51.从上述技术方案可以看出，本发明的基于交互学习降低广告点击率预测中噪声标签影响的预测方法，可以通过有效的多模型交互学习，过滤掉噪声标签，显著提升了对用户点击行为预测的准确性。
附图说明
52.图1所示为本发明实施例中基于交互学习降低广告点击率预测中噪声标签影响的预测方法的流程示意图
53.图2所示为本发明实施例中的交互学习噪声标签数据多级模型的框架示意图
54.图3所示为本发明实施例中的神经网络模型结构图示意图
具体实施方式
55.下面结合附图1-3，对本发明的具体实施方式作进一步的详细说明。
56.在下述的具体实施方式中，在详述本发明的实施方式时，为了清楚地表示本发明的结构以便于说明，针对附图中的结构不依照一般比例绘图，并进行了局部放大、变形及简化处理，因此，应避免以此作为对本发明的限定来加以理解。
57.请参阅图1，图1所示为本发明基于交互学习降低点击率预测中噪声标签影响的方法流程示意图。如图1所示，该方法包括数据预处理步骤s1、训练集的生成步骤s2和预测模型建立步骤s3和营销活动预测步骤s4。
58.在本发明的实施例中，数据预处理步骤非常重要，所述数据预处理步骤s1包括如下步骤：
59.步骤s11：获取n个用户的原始信息，并从所述用户的原始信息提取原始特征信息；其中，所述原始特征信息包括用户id、用户手机号码归属地、用户访问dpi、用户访问时间和/或用户是否点击特征；其中，所述用户号码归属地和用户访问dpi为类别特征，所述用户访问时间为连续特征，所述n大于等于2。
60.请参阅下表1，表1为预处理之前的原始数据的表格描述，预处理之前的原始数据形式如下表1所示：
61.表1
62.[0063][0064]
请注意此时，对于数据的标签，即用户是否点击，只区分为正样本(1)和未标记样本(0)。
[0065]
在本发明的实施例中，上述的原始数据还需要经过异常检测与处理、类别特征处理、连续特征处理和降维处理等步骤。
[0066]
步骤s12：对所述用户的原始信息进行异常检测与处理步骤。
[0067]
异常检测与处理：在结合业务要求的过程中，对于原始数据中的缺失值、过大值等需要进行删除、填充等处理。在数据的采集过程中，由于一般用户量为百万级别，因此，采集过程中可能出现缺失情况；若缺失量较小，一般可直接进行剔除；若无法判断缺失数据是否会影响最终的模型训练效果，则一般可根据取平均数、众数和中位数等方法来填补缺失值。
[0068]
并且在数据采集中，可能还会遇到过大值的问题，比如某用户在一天之内访问了dpi上万次，这种情况一般在实际建模过程中对于提升模型的泛化能力并无特别帮助，因此，也可以采用剔除的处理，或者采用填补的方法进行相应的处理。
[0069]
从上表中可以看出，相比于传统的用户访问数据，每一个用户id对应多个dpi访问记录，同时还给出了访问的时间。
[0070]
步骤s13：对其他连续型或类别型特征进行处理；通过独热编码对类别特征进行处理，利用rankgauss方法对连续特征进行处理。
[0071]
其中，依次按所述任务批次号将所有不同的用户访问dpi作为单独的特征展开，以及在所述任务批次号中将dpi访问频次也按照所有不同的用户访问dpi展开为用户访问dpi与dpi的频次的关系特征。
[0072]
类别特征处理：对于用户号码归属地等类别型特征，可以通过独热编码(one-hot enconding)进行展开。例如，归属地有(hn,ln,sh)，通过独热编码后，某个用户所在的归属地则为1，其他归属地则为0。以用户id为199990为例，其归属地为hn，于是经过独热编码后，其归属地向量为(1,0,0)；对应的，用户199991和199992的归属地向量则为(0,1,0)和(0,0,1)。
[0073]
连续特征处理：对于用户访问时间等连续特征，可利用rankgauss方法，调整数据分布。利用rankgauss方法对于连续特征调整数据分布处理和/或降维步骤；采用主成分分析法对经过类别特征处理后的髙维特征进行降维处理。
[0074]
在本发明的实施例中，采用主成分分析(pca)对髙维特征进行降维处理。由上述对于类别特征的处理可知，一般经过独热编码后，会形成高维稀疏矩阵，对于神经网络的训练而言，这意味着在误差反向传播时，很多地方没有办法求导，这显然是不利于网络训练的。同时，高维度特征，也增加了计算开销。因此有必要对于高维特征先进行降维处理。pca通过求解原始数据在某投影方向的方差最大，实现降维目的；在减少特征维度的同时，尽量减少原始特征包含信息的损失，以达到对所收集数据进行全面分析的目的。
[0075]
请参阅下表2，表2为预处理之后的数据的表格描述：
[0076]
表2
[0077][0078]
经过上述数据处理步骤后，就可以进行训练集的生成步骤s2。
[0079]
本领域技术人员清楚，由于ctr问题一般涉及明显的时间顺序，即；需要预测的是下一个时间点用户的行为。因此一般将其之前的历史数据，即时间序列为作为训练数据(training data)；而对时间点所对应的数据进行本地验证(validation data)。
[0080]
在本发明的实施例中，所述训练集的生成步骤s2包括：
[0081]
s21：将所有所述任务批次号按照升序进行排序，得到所有所述任务批次号的排序；其中，所述任务批次号的升序是同日期时间的远近成正比，所述日期时间越近，所述任务批次号越大；
[0082]
s22：选择所述任务批次号最大的任务批次中的数据作为验证集，剩余的所述任务批次号的数据作为训练集。
[0083]
下面执行预测模型建立步骤s3：基于交互学习的针对噪声标签的多级深度学习网络模型。具体地，
[0084]
s31：建立学习器a、学习器b和学习器c，并将所述训练集数据随机打乱后选择m1％的所述训练集数据分为n个小批次批量数据(mini batch)；其中，所述学习器a采用具有参数w_a的深度学习网络模型a，所述学习器b采用具有参数w_b的深度学习网络模型b，所述学习器c具有参数w_c的深度学习网络模型c；其中，所述深度学习网络模型c为待训练模型。
[0085]
在本发明的实施例中，深度学习网络模型a、深度学习网络模型b和深度学习网络模型可以选择相同的c。请参阅图2，图2所示为本发明实施例中的神经网络模型结构图示意图。如图2所示，所述深度学习网络模型a、深度学习网络模型b和深度学习网络模型c的网络架构可以包括：
[0086]
输入层(input layer)，将原始数据随机打乱后选定一定大小的批次输入；
[0087]
嵌入层(embedding layer)，对所述输入层特征进行信息抽提和降维；
[0088]
多通道自注意力层(multi-channel self-attention layer)，接收降维后的特征，并进行特征的权重分配；
[0089]
全连接层(fully-connected layer)，接收所述多通道自注意力层的输出，进行全连接的网络训练；
[0090]
输出层(output layer)，对于点击的二分类问题，通过sigmoid函数即可输出预测的概率，通过划定阈值即可表示为0/1二分类，所述输出层添加一个神经元。
[0091]
s32：依次选择n个小批次批量数据(d1,d2…dn
)对所述深度学习网络模型a和深度学习网络模型b进行训练，在每个所述批量数据中，所述深度学习网络模型a或深度学习网
络模型b各自选择损失小的样本作为有用知识样本，并将所述有用知识样本传授给另一个深度学习网络模型以进行进一步的训练。
[0092]
请参阅图3，图3所示为本发明实施例中的交互学习噪声标签数据多级模型的框架示意图。如图3所示，步骤s32可以具体包括：
[0093]
步骤s321：获取一个小批量数据d输入模型时，在所述小批量数据d上选择一部分数据深度学习网络模型a，另一部分在深度学习网络模型b中进行训练；两个深度学习网络模型的样本的数量由参数r控制，所述参数r为选择的百分比；
[0094]
步骤s322：深度学习网络模型a和深度学习网络模型b在训练中产生的损失函数记为loss_a和loss_b，接下来进行判断：若loss_a小于loss_b，则将深度学习网络模型a的损失回传给深度学习网络模型b；若loss_a大于loss_b，则将深度学习网络模型的损失函数回传给深度学习网络模型a，并通过损失函数的反向传播进行参数的更新，以通过两个网络自适应地校正另一个网络的训练错误；
[0095]
步骤s323：重复步骤s321和s322，直到完成所有小批量数据d的数据训练。
[0096]
步骤s33：将步骤s32所训练得到的深度学习网络模型a和深度学习网络模型b的参数加权相加，并传递给深度学习网络模型c，完成剩余20％数据的训练，得到最终的分类深度学习网络模型。
[0097]
在上述步骤中，对样本数量的控制参数r解释如下：
[0098]
在噪声数据集上，即使存在噪声标签，深层网络也会在开始时学习干净简单的模式。因此，他们能够在训练开始时使用他们的损失值过滤掉噪声的样本。然而，问题在于随着不断的训练，它们最终会过拟合噪声标签。为了解决这个问题，我们希望在开始时的小批量中保留更多样本，即r很大。
[0099]
然后，我们逐渐增加丢弃率，即r变小，这样我们就可以在网络记忆它们之前保持干净的样本并丢弃那些噪声样本。
[0100]
在本发明的实施例中，步骤s3还可以包括对所述基于交互学习降低广告点击率预测中噪声标签影响的预测方法模型的营销活动预测模型进行模型评价指标处理和调优处理；所述模型评价指标包括auc值、log loss值和相对信息增益rig值。
[0101]
所述模型评价指标包括auc(area under curve)值、log loss值和相对信息增益rig(relative information gain)值。一般来说，auc值越接近1，则模型分类效果越好。log loss值越小，说明点击率预估的准确度越高；相对信息增益值越大模型效果越好。
[0102]
例如，在对数据按照上述步骤处理并通过模型训练后，通过本地验证的auc值，可以判断该模型的训练效果；若效果较差，一般需要对模型进行调优，对于深度学习算法，一般可从如下几方面进行优化：
[0103]
①
、增加批归一化(batch normalization)，解决数据的内部协变量偏移问题(internal covariate shift)。
[0104]
②
、在网络中增加dropout，即让部分神经元在训练过程中处于休眠状态。
[0105]
③
、调整学习率，一般会通过指数式衰减等策略调整训练过程中的学习率。
[0106]
④
、设置多种子训练取平均，降低训练过程中的过拟合风险。
[0107]
⑤
、增加l1或者l2正则化，对损失函数施加惩罚，以降低过拟合风险。
[0108]
⑥
、超参数的优化。
[0109]
在对超参数的优化方法上，一般可以采用网格搜索(grid search)或者随机搜索(random search)；但上述两种方法对于计算资源的消耗较大，且效率不高。在本发明的实施例中，采用贝叶斯优化(bayesian optimization)策略。贝叶斯优化通过高斯过程回归计算前面n个数据点的后验概率分布，得到每一个超参数在每一个取值点的均值和方差；贝叶斯优化通过均衡均值和方差，根据超参数间的联合概率分布，最终选择一组较好的超参数。
[0110]
上述所有处理步骤完成后，就可以通过将上述特征带入训练好的用户预测模型，能够提前在广告投放之前就筛选出意愿较高的部分用户，并对这些用户进行营销广告的精准投放。
[0111]
即本发明还可以还包括营销活动预测步骤s4，所述步骤s4具体包括：
[0112]
步骤s41：获取拟对营销活动点击预测的用户群体和所述用户群体的用户原始信息，并从所述用户原始信息提取原始特征信息；其中，所述原始特征信息包括用户id、用户手机号码归属地、任务批次号、用户访问dpi、用户访问dpi频次和/或用户是否点击特征；
[0113]
步骤s42：对每一个所述用户的原始信息进行异常检测与处理步骤；通过独热编码对类别特征进行处理，利用rankgauss方法对连续特征进行处理；
[0114]
步骤s43：提供建立训练好的预测网络模型，依次使用从所述用户原始信息提取原始特征信，得到拟对营销活动点击预测的用户群体中所有所述用户的预测值；其中，所述用户的模型预测值为所述用户的点击意愿度；
[0115]
步骤s44：根据实际投放需求，选择全部或部分所述用户的模型预测值集中点击意愿度为1的用户进行精准营销的任务。
[0116]
结果表明，通过本发明的方法，可以有效利用多模型的交互学习过滤掉噪声标签，显著提升了对用户点击行为预测的准确性。
[0117]
以上所述的仅为本发明的优选实施例，所述实施例并非用以限制本发明的专利保护范围，因此凡是运用本发明的说明书及附图内容所作的等同结构变化，同理均应包含在本发明的保护范围内。

技术特征：
1.一种基于交互学习降低点击率预测中噪声标签影响的方法，其特征在于，包括据预处理步骤s1、训练集的生成步骤s2和预测模型建立步骤s3；所述数据预处理步骤s1包括如下步骤：步骤s11：获取n个用户的原始信息，并从所述用户的原始信息提取原始特征信息；其中，所述原始特征信息包括用户id、用户手机号码归属地、任务批次号、用户访问dpi、用户访问dpi频次和/或用户是否点击特征；所述任务批次号表示一个日期时间段中用户的原始信息，所述用户访问dpi和用户访问dpi频次为每一个任务批次号为计量单位，所述n大于等于2；步骤s12：依次处理具有所述任务批次号的所有批次中的所述原始特征信息，对所述用户的原始特征信息进行异常检测与处理步骤；步骤s13：依次处理具有所述任务批次号的所有批次中的所述原始特征信息，通过独热编码对类别特征进行处理，并利用rankgauss方法对连续特征进行处理；其中，依次按所述任务批次号将所有不同的用户访问dpi作为单独的特征展开，以及在所述任务批次号中将dpi访问频次也按照所有不同的用户访问dpi展开为用户访问dpi与dpi的频次的关系特征；所述训练集的生成步骤s2包括：s21：将所有所述任务批次号按照升序进行排序，得到所有所述任务批次号的排序；其中，所述任务批次号的升序是同日期时间的远近成正比，所述日期时间越近，所述任务批次号越大；s22：选择所述任务批次号最大的任务批次中的数据作为验证集，剩余的所述任务批次号的数据作为训练集；所述预测模型建立步骤s3包括：s31：建立学习器a、学习器b和学习器c，并将所述训练集数据随机打乱后选择m1％的所述训练集数据分为n个小批次批量数据；其中，所述学习器a采用具有参数w_a的深度学习网络模型a，所述学习器b采用具有参数w_b的深度学习网络模型b，所述学习器c具有参数w_c的深度学习网络模型c；所述深度学习网络模型c为待训练模型；s32：依次选择n个小批次批量数据(d1,d2…
d
n
)对所述深度学习网络模型a和深度学习网络模型b进行训练，在每个所述批量数据中，所述深度学习网络模型a或深度学习网络模型b各自选择损失小的样本作为有用知识样本，并将所述有用知识样本传授给另一个深度学习网络模型以进行进一步的训练；s33：将步骤s32所训练得到的深度学习网络模型a和深度学习网络模型b的参数加权相加得到参数w_c，并传递给具有参数w_c的深度学习网络模型c，完成剩余m2％数据的训练，得到最终参数优化后的深度学习网络模型c，并使用验证集进行验证，得到最终的预测网络模型，其中，m1+m2＝100。2.根据权利要求1所述的方法，其特征在于，所述深度学习网络模型a、深度学习网络模型b和深度学习网络模型c的网络架构包括：输入层，将原始数据随机打乱后选定一定大小的批次输入；嵌入层，对所述输入层特征进行信息抽提和降维；多通道自注意力层，接收降维后的特征，并进行特征的权重分配；
全连接层，接收所述多通道自注意力层的输出，进行全连接的网络训练；输出层，对于点击的二分类问题，通过sigmoid函数即可输出预测的概率，通过划定阈值即可表示为0/1二分类，所述输出层添加一个神经元。3.根据权利要求1所述的方法，其特征在于，所述s32包括：步骤s321：获取一个小批量数据d输入模型时，在所述小批量数据d上选择一部分数据深度学习网络模型a，另一部分在深度学习网络模型b中进行训练；两个深度学习网络模型的样本的数量由参数r控制，所述参数r为选择的百分比；步骤s322：深度学习网络模型a和深度学习网络模型b在训练中产生的损失函数记为loss_a和loss_b，接下来进行判断：若loss_a小于loss_b，则将深度学习网络模型a的损失回传给深度学习网络模型b；若loss_a大于loss_b，则将深度学习网络模型的损失函数回传给深度学习网络模型a，并通过损失函数的反向传播进行参数的更新，以通过两个网络自适应地校正另一个网络的训练错误；步骤s323：重复步骤s321和s322，直到完成所有小批量数据d的数据训练。4.根据权利要求1所述的方法，其特征在于，还包括营销活动预测步骤s4，其具体包括：步骤s41：获取拟对营销活动点击预测的用户群体和所述用户群体的用户原始信息，并从所述用户原始信息提取原始特征信息；其中，所述原始特征信息包括用户id、用户手机号码归属地、任务批次号、用户访问dpi、用户访问dpi频次和/或用户是否点击特征；步骤s42：对每一个所述用户的原始信息进行异常检测与处理步骤；通过独热编码对类别特征进行处理，利用rankgauss方法对连续特征进行处理；步骤s43：提供建立训练好的预测网络模型，依次使用从所述用户原始信息提取原始特征信，得到拟对营销活动点击预测的用户群体中所有所述用户的预测值；其中，所述用户的模型预测值为所述用户的点击意愿度。5.根据权利要求4所述的方法，其特征在于，所述模型预测步骤s4还包括：步骤s44：根据实际投放需求，选择全部或部分所述用户的模型预测值集中点击意愿度为1的用户进行精准营销的任务。6.根据权利要求1所述的方法，其特征在于，所述步骤s3中还包括步骤s37，对所述基于交互学习降低广告点击率预测中噪声标签影响的预测方法模型的营销活动预测模型进行模型评价指标处理和调优处理；所述模型评价指标包括auc值、log loss值和相对信息增益rig值。7.根据权利要求6所述的方法，其特征在于，所述模型调优处理包括如下一种或几种：增加批归一化，解决数据的内部协变量偏移问题；在网络中增加让部分神经元在训练过程中处于休眠状态的功能；调整学习率，一般会通过指数式衰减等策略调整训练过程中的学习率；设置多种子训练取平均，以提高由于数据方差较大引起的泛化能力不足的问题；增加l1或者l2正则化，对损失函数施加惩罚，以降低过拟合风险；对超参数的优化方法。8.根据权利要求1所述的方法，其特征在于，所述m1:m2＝8:2。

技术总结
一种基于交互学习降低点击率预测中噪声标签影响的方法，包括据预处理步骤、训练集的生成步骤、预测模型建立步骤和营销活动预测步骤；在预测模型建立步骤中，依次选择N个小批次批量数据(D1,D2…

技术研发人员：项亮潘信法
受保护的技术使用者：上海数鸣人工智能科技有限公司
技术研发日：2022.06.13
技术公布日：2022/11/1

转载请注明原文地址: https://tieba.8miu.com/read-113.html

专利

最新回复(0)