一种电力服务话务量预测方法与流程

专利2023-06-27  128



1.本发明涉及专门适用于预测目的的数据处理方法,具体涉及一种一种电力服务话务量预测方法。


背景技术:

2.电力服务行业业务量波动具有一定的特殊性,在时间轴上呈现不确定性、跳跃性、波动随机分布等特征,并受天气、账期、节假日、保电活动等因素影响,均会不同程度地增加或减少相应时段地电话呼入量等,由于影响话务波动的因素较多,导致电力服务行业电话请求量离散型较大、稳定性较差,预测难度较大,因此分析行业预测趋势,准确建立包含多种影响因子的预测模型是提升预测准确性的关键。但是,目前无先进的预测工具支撑,预测工作需要手工开展,较大程度上阻滞了预测工作的开展进度,影响预测准确率。而准确预测各省份、各业务类型的话务量直接影响了分中心对于人员排班的管理,可有效发挥人员效能、节约用工成本的支撑作用越大。
3.移动平均模型、指数平滑、arima(差分整合移动平均自回归模型)、梯度回归是话务量预测中常用的的预测模型,但是在实验过程中对于由工作转为假期、由假期转为工作阶段的数据的预测结果波动巨大,因此提出分块数据的话务量预测,即将工作日数据与休假数据分别处理预测。
4.上述4种模型能够取得一定效果,但都未普遍适应多省份多业务的繁杂的话务量预测。


技术实现要素:

5.本文最初选取了广泛用于许多序列任务(如天然气负荷预测,股票市场预测)且预测效果不错的lstm(长短期记忆神经网络),然而lstm陷入超参数选择的泥潭,耗费时间。因此本文结合算术优化算法(arithmetic optimization algorithm,aoa)优化lstm模型,构建aoa-lstm模型,获得优异的预测效果。
6.最后将这些模型全部正常预测后,发现整个过程耗费时间较长,不能满足正常的工作需求。因此结合多线程技术添加到各模型预测,预测耗时大大缩短,为原来的1/4。
7.基于此种现状,本发明考虑到大数据技术在数据处理方面的优势,以及分业务预测、多数学模型比对预测在提升预测准确率方面的必要性,通过研究呼叫行业常见预测方法,开发了一种基于电力服务特点的多模型话务预测工具,通过有效管理电力服务话务量数据、深入分析话务量波动趋势特点,将话务量影响因子转化为模型系数,建立了多种预测模型,实现了对话务量的自主预测、多模型比对推优预测,保障了预测工作准确高效,可为人员需求与人员排班提供有效依据,支撑人员管控精益高效。具体技术方案如下:
8.一种电力服务话务量预测方法,包括如下过程:
9.步骤s1:对过往的话务量数据与话务影响因素数据进行收集获取,形成话务量数据集;具体包括:
10.步骤s11:对原始话务工单表数据按小时、日、月统计话务量数据;
11.步骤s12:从数据库中和对应官网获取账期、保电活动、天气、节假日话务因素数据;
12.步骤s13:将话务量数据与话务因素数据集成形成话务量数据集;
13.步骤s2:对话务量数据集数据进行预处理,形成话务量预测数据集;具体包括:
14.步骤s21:使用k-means++算法发掘话务量数据集中电话接听量、电话呼入量的异常值,并删除;
15.步骤s22:使用插值法与随机森林法填充空值,对于电话接听量》电话呼入量时令电话接听量=电话呼入量;
16.步骤s23:对填充后的电话接听量、电话呼入量数据进行min-max标准化;对于话务量数据的min-max标准化是对话务量原始数据做线性变换,使得转化后的结果结果值落到[0,1]区间中,公式如下:
[0017][0018]
其中x为话务量具体数据,max为话务量数据的最大值,min为话务量数据的最小值,x是min-max标准化后的话务量数据;
[0019]
步骤s24:话务量数据集中的统计省份、业务类型与星期、休假标志分别进行标签编码(label encoding)与独热编码(one-hot encoding)作为话务量预测数据集;
[0020]
步骤s3:将话务量预测数据集按照工作日与休息日分为工作日数据集与休息日数据集,开启多线程技术,将数据分别放入模型预测;具体步骤包括:
[0021]
步骤s31:将话务量预测数据集放入移动平均模型测试确定移动平均项数,之后结合多线程技术将工作日数据集与休息日数据集分别放入含有具体移动平均项数的移动平均模型,获得话务量预测结果一;
[0022]
步骤s32:将话务量预测数据集进行一次指数平滑、二次指数平滑,对比不同次数平滑的预测值与真实话务的均方误差,选取确定较优次数平滑模型;分别将工作日话务量预测数据集与休息日工作日放入模型,结合多线程技术进行预测,最后将得到的话务量预测结果融合形成话务量预测结果二;
[0023]
步骤s33:对话务量预测数据进行平稳性检验,判别话务量预测数据集是否平稳;之后使用差分构建平稳序列,确定参数差分阶数d;接着使用acf/pacf图对该序列进行定阶,即确定参数自回归项数p、移动平均项数q;然后构建arima模型,即使用aic、bic等标准对其效果进行评估,选出最优模型;对arima模型进行残差分析,即查看残差是否为白噪音;最后确定arima模型,结合多线程技术将工作日数据集与休息日数据集分别放入模型,获得话务量预测结果三;
[0024]
步骤s34:将话务量预测数据集放入梯度回归模型,使用网格搜索算法确定较优的超参数,之后结合多线程技术将工作日数据集与休息日数据集分别放入含有具体参数的梯度回归模型,获得话务量预测结果四;
[0025]
步骤s35:将话务量预测数据集放入lstm模型进行测试,使用aoa优化算法寻找最优参数,然后将工作日话务量预测数据集与休息日工作日预测数据集放入含有最优参数的lstm模型,结合多线程技术进行预测,最后将得到的话务量预测结果融合形成话务量预测
结果五;
[0026]
步骤s4:最后对各模型预测的数据对比择优,实现预测修正调整与准确率提升;具体包括如下步骤:
[0027]
步骤s41:将步骤s3中五个模型每个时序预测场景下,过去近60个观察周期的预测值与实际值的数据分别存入数据表;
[0028]
步骤s42:引入均方误差mse、均方根误差rmse、平均绝对值误差mae时间序列预测评价指标,分别计算预测值与实际值相应指标值;
[0029]
步骤s43:通过上述模型评价指标,选取最优模型,输入模型相应的预测值。
[0030]
优选方案,所述步骤32中一次指数平滑法的递推关系如下:
[0031][0032]
其中,分别是第t个时间点与第t-1个时间点的话务量实际值经过一次平滑后的值,x
t-1
是第t-1个时间点的话务量实际值;α是两个时间点话务量之间的权重,范围为0-1;
[0033]
一次平滑的预测公式为:
[0034][0035]
其中可以作为第t+1个话务量的预测值。
[0036]
进一步优选,所述步骤32中二次指数平滑法的递推关系如下:
[0037]
二次指数平滑将一次平滑值作为一个变量,构建了趋势公式,并与原有的一次平滑递推组成方程组,如下:
[0038][0039]
二次平滑的预测公式为:
[0040]
x
t+t
=a
t
+b
t
t
[0041]
其中t为预测时长,
[0042]
本发明的有益效果:
[0043]
(一)获取话务量数据,利用大数据技术进行处理分析,通过研究时间序列法、梯度回归法、神经网络法等预测方法的优缺点,首次建立了分省、分业务双维度预测模型,解决了客服中心目前预测工作缺少系统工具支撑的问题。
[0044]
(二)建立了话务影响因子录入与维护模块,作为话务预测模型的重要参数。
[0045]
(三)三是目前工具中包含了5种预测模型,通过内部算法,进行各模型预测值与实际话务值之间的差值比对,从而针对不同省份、不同业务分别匹配出精度最佳的应用模型;通过分析5种预测模型近期准确率走势,进行预测取值、模型应用的对比决策,实现了对应用模型预测准确性的整体评估,全方面进行应用模型调整、预测结果修正,提升预测准确率。
[0046]
(四)建立了话务预测准确率在线分析功能,提前在工具中嵌入分析模板,模板中数据与话务量数据、录入维护的话务影响因子数据联动,从而分别从分省维度、分业务维度定位话务预测失准原因,并且支持分析结果导出应用,解决了人工导表与分析的问题。
附图说明:
[0047]
图1是本专利方法的流程图。
具体实施方式:
[0048]
实施例:
[0049]
相关术语解释:
[0050]
分省预测:对各服务省份各自的话务量开展预测。
[0051]
分业务预测:特指分中心目前对话务划分的三种类型:即故障报修业务、综合业务、投诉举报业务。
[0052]
自主预测:该预测工具可接入系统话务量数据,自行对次日、次月各省份、各业务类型话务量进行预测,推送显示预测结果。
[0053]
双维度预测:既可以进行省维度的话务量预测,也可以开展三类业务维度的话务量预测。
[0054]
一种电力服务话务量预测方法,包括如下过程:
[0055]
步骤s1:对过往的话务量数据与话务影响因素数据进行收集获取,形成话务量数据集;具体包括:
[0056]
步骤s11:对原始话务工单表数据按小时、日、月统计话务量数据;
[0057]
步骤s12:从数据库中和对应官网获取账期、保电活动、天气、节假日话务因素数据;
[0058]
步骤s13:将话务量数据与话务因素数据集成形成话务量数据集;
[0059]
步骤s2:对话务量数据集数据进行预处理,形成话务量预测数据集;具体包括:
[0060]
步骤s21:使用k-means++算法发掘话务量数据集中电话接听量、电话呼入量的异常值,并删除;
[0061]
步骤s22:使用插值法与随机森林法填充空值,对于电话接听量》电话呼入量时令电话接听量=电话呼入量;
[0062]
步骤s23:对填充后的电话接听量、电话呼入量数据进行min-max标准化;对于话务量数据的min-max标准化是对话务量原始数据做线性变换,使得转化后的结果结果值落到[0,1]区间中,公式如下:
[0063][0064]
其中x为话务量具体数据,max为话务量数据的最大值,min为话务量数据的最小值,x是min-max标准化后的话务量数据;
[0065]
步骤s24:话务量数据集中的统计省份、业务类型与星期、休假标志分别进行标签编码(label encoding)与独热编码(one-hot encoding)作为话务量预测数据集;
[0066]
对于数据的标签编码与独热编码效果如下:
[0067][0068]
步骤s3:将话务量预测数据集按照工作日与休息日分为工作日数据集与休息日数据集,开启多线程技术,将数据分别放入模型预测;具体步骤包括:
[0069]
步骤s31:将话务量预测数据集放入移动平均模型测试确定移动平均项数,之后结合多线程技术将工作日数据集与休息日数据集分别放入含有具体移动平均项数的移动平均模型,获得话务量预测结果一;
[0070]
步骤s32:将话务量预测数据集进行一次指数平滑、二次指数平滑,对比不同次数平滑的预测值与真实话务的均方误差,选取确定较优次数平滑模型;分别将工作日话务量预测数据集与休息日工作日放入模型,结合多线程技术进行预测,最后将得到的话务量预测结果融合形成话务量预测结果二;
[0071]
一次指数平滑法的递推关系如下:
[0072][0073]
其中,分别是第t个时间点与第t-1个时间点的话务量实际值经过一次平滑后的值,x
t-1
是第t-1个时间点的话务量实际值;α是两个时间点话务量之间的权重,范围为0-1;
[0074]
一次平滑的预测公式为:
[0075][0076]
其中可以作为第t+1个话务量的预测值;
[0077]
二次指数平滑法的递推关系如下:
[0078]
二次指数平滑将一次平滑值作为一个变量,构建了趋势公式,并与原有的一次平滑递推组成方程组,如下:
[0079][0080]
二次平滑的预测公式为:
[0081]
x
t+t
=a
t
+b
t
t
[0082]
其中t为预测时长,
[0083]
步骤s33:对话务量预测数据进行平稳性检验,判别话务量预测数据集是否平稳;
之后使用差分构建平稳序列,确定参数差分阶数d;接着使用acf/pacf图对该序列进行定阶,即确定参数自回归项数p、移动平均项数q;然后构建arima模型,即使用aic、bic等标准对其效果进行评估,选出最优模型;对arima模型进行残差分析,即查看残差是否为白噪音;最后确定arima模型,结合多线程技术将工作日数据集与休息日数据集分别放入模型,获得话务量预测结果三;
[0084]
步骤s34:将话务量预测数据集放入梯度回归模型,使用网格搜索算法确定较优的超参数,之后结合多线程技术将工作日数据集与休息日数据集分别放入含有具体参数的梯度回归模型,获得话务量预测结果四;
[0085]
步骤s35:将话务量预测数据集放入lstm模型进行测试,使用aoa优化算法寻找最优参数,然后将工作日话务量预测数据集与休息日工作日预测数据集放入含有最优参数的lstm模型,结合多线程技术进行预测,最后将得到的话务量预测结果融合形成话务量预测结果五;
[0086]
其中aoa是一种根据算术操作符的分布特性实现全局寻优的元启发式优化算法;它主要有三个阶段组成:搜索阶段,通过数学优化器加速函数选择搜索;探索阶段,通过乘法、除法运算实现全局搜索;开发阶段,利用加法减法运算实现局部开发,更新位置;优势是在寻参时具有收敛速度快,精度高等特点;
[0087]
搜索阶段:
[0088]
当r1》moa时,aoa进行全局探索;
[0089]
当r1《moa时,aoa进入局部开发阶段;
[0090][0091]
其中,r1代表0到1之间的随机值;t是当前迭代次数,t是最大迭代次数;min与max分别是加速函数的最小值和最大值,为0.2和1;
[0092]
探索阶段:
[0093]
当r2《0.5时,执行除法搜索策略;
[0094]
当r2》0.5时,执行乘法搜索策;
[0095]
mop(t)=1-(t1/t
1/α
)
[0096]
其位置更新公式为
[0097][0098]
其中,r2代表0到1之间的随机值,μ是控制参数,值为0.499;ε为极小值;
[0099]
开发阶段:
[0100]
其位置更新公式:
[0101][0102]
其中r3代表0到1之间的随机值;
[0103]
步骤s4:最后对各模型预测的数据对比择优,实现预测修正调整与准确率提升;具体包括如下步骤:
[0104]
步骤s41:将步骤s3中五个模型每个时序预测场景下,过去近60个观察周期的预测值与实际值的数据分别存入数据表;
[0105]
步骤s42:引入均方误差mse、均方根误差rmse、平均绝对值误差mae时间序列预测评价指标,分别计算预测值与实际值相应指标值;
[0106]
均方误差mse(mean squared error):计算所有话务量实际值与话务量预测值间误差平方和的平均值;均方根误差rmse(root mean squared error):是mse的算数平方根;由于每个误差对rmse的影响与误差的平方(squared error)成正比,因此较大的误差会对rmse影响过大,rmse对异常值很敏感;平均绝对值误差mae(mean absolute error):是时间序列分析中预测误差常用的指标,平均绝对误差是所有单个实际值与算术平均值的偏差的绝对值的平均,平均绝对误差可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小;
[0107]
步骤s43:通过上述模型评价指标,选取最优模型,输入模型相应的预测值。

技术特征:
1.一种电力服务话务量预测方法,其特征在于,包括如下过程:步骤s1:对过往的话务量数据与话务影响因素数据进行收集获取,形成话务量数据集;具体包括:步骤s11:对原始话务工单表数据按小时、日、月统计话务量数据;步骤s12:从数据库中和对应官网获取账期、保电活动、天气、节假日话务因素数据;步骤s13:将话务量数据与话务因素数据集成形成话务量数据集;步骤s2:对话务量数据集数据进行预处理,形成话务量预测数据集;具体包括:步骤s21:使用k-means++算法发掘话务量数据集中电话接听量、电话呼入量的异常值,并删除;步骤s22:使用插值法与随机森林法填充空值,对于电话接听量>电话呼入量时令电话接听量=电话呼入量;步骤s23:对填充后的电话接听量、电话呼入量数据进行min-max标准化;对于话务量数据的min-max标准化是对话务量原始数据做线性变换,使得转化后的结果结果值落到[0,1]区间中,公式如下:其中x为话务量具体数据,max为话务量数据的最大值,min为话务量数据的最小值,x是min-max标准化后的话务量数据;步骤s24:话务量数据集中的统计省份、业务类型与星期、休假标志分别进行标签编码(label encoding)与独热编码(one-hot encoding)作为话务量预测数据集;步骤s3:将话务量预测数据集按照工作日与休息日分为工作日数据集与休息日数据集,开启多线程技术,将数据分别放入模型预测;具体步骤包括:步骤s31:将话务量预测数据集放入移动平均模型测试确定移动平均项数,之后结合多线程技术将工作日数据集与休息日数据集分别放入含有具体移动平均项数的移动平均模型,获得话务量预测结果一;步骤s32:将话务量预测数据集进行一次指数平滑、二次指数平滑,对比不同次数平滑的预测值与真实话务的均方误差,选取确定较优次数平滑模型;分别将工作日话务量预测数据集与休息日工作日放入模型,结合多线程技术进行预测,最后将得到的话务量预测结果融合形成话务量预测结果二;步骤s33:对话务量预测数据进行平稳性检验,判别话务量预测数据集是否平稳;之后使用差分构建平稳序列,确定参数差分阶数d;接着使用acf/pacf图对该序列进行定阶,即确定参数自回归项数p、移动平均项数q;然后构建arima模型,即使用aic、bic等标准对其效果进行评估,选出最优模型;对arima模型进行残差分析,即查看残差是否为白噪音;最后确定arima模型,结合多线程技术将工作日数据集与休息日数据集分别放入模型,获得话务量预测结果三;步骤s34:将话务量预测数据集放入梯度回归模型,使用网格搜索算法确定较优的超参数,之后结合多线程技术将工作日数据集与休息日数据集分别放入含有具体参数的梯度回归模型,获得话务量预测结果四;步骤s35:将话务量预测数据集放入lstm模型进行测试,使用aoa优化算法寻找最优参
数,然后将工作日话务量预测数据集与休息日工作日预测数据集放入含有最优参数的lstm模型,结合多线程技术进行预测,最后将得到的话务量预测结果融合形成话务量预测结果五;步骤s4:最后对各模型预测的数据对比择优,实现预测修正调整与准确率提升;具体包括如下步骤:步骤s41:将步骤s3中五个模型每个时序预测场景下,过去近60个观察周期的预测值与实际值的数据分别存入数据表;步骤s42:引入均方误差mse、均方根误差rmse、平均绝对值误差mae时间序列预测评价指标,分别计算预测值与实际值相应指标值;步骤s43:通过上述模型评价指标,选取最优模型,输入模型相应的预测值。2.根据权利要求1所述一种电力服务话务量预测方法,其特征在于,所述步骤32中一次指数平滑法的递推关系如下:其中,分别是第t个时间点与第t-1个时间点的话务量实际值经过一次平滑后的值,x
t-1
是第t-1个时间点的话务量实际值;α是两个时间点话务量之间的权重,范围为0-1;一次平滑的预测公式为:其中可以作为第t+1个话务量的预测值。3.根据权利要求2所述一种电力服务话务量预测方法,其特征在于,所述步骤32中二次指数平滑法的递推关系如下:二次指数平滑将一次平滑值作为一个变量,构建了趋势公式,并与原有的一次平滑递推组成方程组,如下:二次平滑的预测公式为:x
t+t
=a
t
+b
t
t其中t为预测时长,

技术总结
本发明涉及一种电力服务话务量预测方法。预测方法包括如下过程:对过往的话务量数据与话务影响因素数据进行收集获取,形成话务量数据集;对话务量数据集数据进行预处理,形成话务量预测数据集;将话务量预测数据集按照工作日与休息日分为工作日数据集与休息日数据集,开启多线程技术,将数据分别放入模型预测;最后对各模型预测的数据对比择优,实现预测修正调整与准确率提升;本发明的有益效果:获取话务量数据,利用大数据技术进行处理分析,通过研究时间序列法、梯度回归法、神经网络法等预测方法的优缺点,首次建立了分省、分业务双维度预测模型,解决了客服中心目前预测工作缺少系统工具支撑的问题。系统工具支撑的问题。系统工具支撑的问题。


技术研发人员:孔梅娟 王秀春 何学东 王明珠 夏晓宇 彭渤 郝景昌 陈哲 高茜 杨楠
受保护的技术使用者:国家电网有限公司客户服务中心
技术研发日:2022.07.25
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-3543.html

最新回复(0)