一种基于用电负荷的挖矿行为识别方法与流程

专利2023-10-15  97



1.本发明属于挖矿行为检测领域,尤其涉及一种基于用电负荷的挖矿行为识别方法。


背景技术:

2.由于挖矿行为占用大量的电力资源和计算资源,目前通常基于用电量进行一系列特征分析,并针对用电量的特征设置阈值判断的识别算法以检测并打击挖矿行为。但因各地经济发展情况不同、各类用户用电习惯不同等原因,所设置的识别算法应用在不同地区的识别精度存在差异,不利于各地区识别出可疑的挖矿用户。


技术实现要素:

3.为了解决现有技术中存在的因各地经济发展情况不同、各类用户用电习惯不同等原因而增加识别难度的缺点和不足,本发明提出了一种基于用电负荷的挖矿行为识别方法,包括:获取用户在一定时段的月用电量数据和月用电运行容量,计算用户在所述时段期间的月均用电量,将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户;分别计算疑似挖矿用户的用电量标准差,结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值;根据各个用户的所述特征值的概率分布情况,分别确定各个特征值的第二阈值,根据第二阈值在疑似挖矿用户中进行一次筛选;根据用户户名对一次筛选出的疑似挖矿用户进行二次筛选,将二次筛选出的用户标记为存在挖矿行为的用户。
4.可选的,所述第一阈值的设置为用户所在地区中月均用电总量的3倍。
5.可选的,所述分别计算疑似挖矿用户的用电量标准差,结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值,包括:将用户的用电量标准差和月均用电量的比值作为特征值中的第一特征值;将用户的用电量标准差与月用电运行容量的比值作为特征值中的第二特征值;将用户的月均用电量与月用电运行容量的比值作为特征值中的第三特征值;计算用户的用电量与虚拟货币价格之间的皮尔逊相关系数,将所述皮尔逊相关系数作为第四特征值。
6.可选的,所述皮尔逊相关系数的计算过程包括:
其中,ri表示皮尔逊相关系数,表示第i位用户前第j个月的月电量,表示用户前 n个月的月均用电量,pj表示虚拟货币在前第j个月的月均价格,表示虚拟货币在前n个月的平均价格。
7.可选的,所述根据各个用户的所述特征值的概率分布情况,分别确定各个特征值的第二阈值,包括:分别绘制第一特征值、第二特征值、第三特征值的频次直方图,确定频次直方图近似满足的概率分布类型;分别根据第一特征值、第二特征值、第三特征值近似满足的概率分布类型,确定用于确定阈值分位数,将所述阈值分位数上的数值作为对应第一特征值、第二特征值、第三特征值的第二阈值;将对应第四特征值的第二阈值设置为人工经验设定的定值。
8.可选的,所述概率分布类型包括正态分布和卡方分布。
9.可选的,所述根据用户户名对一次筛选出的疑似挖矿用户进行二次筛选,将二次筛选出的用户标记为存在挖矿行为的用户,包括:根据户名剔除特殊用电用户,所述特殊用电用户包括通信运营商、铁塔公司、农村经济合作社、物业公司以及建筑公司。
10.可选的,在将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户之后,所述挖矿行为识别方法还包括:若用户所在地区的运营商对dns服务器启动域名混淆,则计算域名混淆前后的矿池算力差值;获取疑似挖矿用户的日用电量,计算用户的日用电量与矿池算力差值之间的皮尔逊相关系数为:其中,li表示第i个用户的日用电量与矿池算力之间的皮尔逊相关系数,表示第i个用户在第j天的日用电量,表示第i个用户在n天内的日平均用电量,qj表示第j天的矿池算力差值,表示n天内平均矿池算力差值;根据li对疑似挖矿用户进行进一步缩小范围,将li小于预设值的疑似挖矿用户去除标记。
11.本发明提供的技术方案带来的有益效果是:本技术通过对用户的用电量数据进行变化趋势以及特征分析,从而得到用于表征用户挖矿行为可能性的各项指标,并考虑到因各地经济发展情况不同、用户用电类别不同等原因,直接给定固定的指标阈值不利于识别可疑的挖矿用户,所以根据各项指标的分布情况来灵活划定指标阈值,提高了识别方法的适用性以及识别结果的准确性,进而能够基
于识别结果对相关人员的行为进行限电、警告等打击措施。
附图说明
12.为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
13.图1为本发明实施例提出的一种基于用电负荷的挖矿行为识别方法的流程示意图。
具体实施方式
14.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
15.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
16.应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
17.应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
18.应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含a、b和c”、“包含a、b、c”是指a、b、c三者都包含,“包含a、b或c”是指包含a、b、c三者之一,“包含a、b和/或c”是指包含a、b、c三者中任1个或任2 个或3个。
19.应当理解,在本发明中,“与a对应的b”、“与a相对应的b”、“a与b相对应”或者“b与a相对应”,表示b与a相关联,根据a可以确定b。根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。a与b的匹配,是a与b的相似度大于或等于预设的阈值。
20.取决于语境,如在此所使用的“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。
21.下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
22.实施例:如图1所示,本实施例提出了一种基于用电负荷的挖矿行为识别方法,包括:
s1:获取用户在一定时段的月用电量数据和月用电运行容量,计算用户在所述时段期间的月均用电量,将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户;s2:分别计算疑似挖矿用户的用电量标准差,结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值;s3:根据各个用户的所述特征值的概率分布情况,分别确定各个特征值的第二阈值,根据第二阈值在疑似挖矿用户中进行一次筛选;s4:根据用户户名对一次筛选出的疑似挖矿用户进行二次筛选,将二次筛选出的用户标记为存在挖矿行为的用户。
23.在本实施例中,各低压用电用户通过智能电表将每日用电数据上传至数据中台。通过数据中台的数据库取数获取特定地区前n个月用户i的每个月的用电量运行容量ci,并计算各用户这n个月的月均用电量即有:上式中,n一般取大于等于6的正整数,表示第i位用户前第j个月的月电量。
24.因挖矿行为存在用电负荷异常偏大、负荷曲线较为平稳的特点,在本实施例中首先划定可疑挖矿用户的月均电量阈值x
thr
作为第一阈值,当大于等于x
thr
时认为该用户存在挖矿的可能性,需要进行进一步分析判断,因此将其标记为疑似挖矿用户,当小于x
thr
时认为该用户不存在挖矿的可能性。
25.在本实施例中,x
thr
的取值与地区经济发展水平相关,一般将所述第一阈值x
thr
的设置为用户所在地区中月均用电总量的3倍。
26.本实施例还在将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户之后,通过分析算力扰动与用电量波动之间的相关性,进一步缩小疑似用户的范围。其分析原理在于,目前为了限制挖矿行为,会对dns服务器使用域名混淆,混淆期间地区算力消失会导致区块链网络总算力有较大跌落,算力即虚拟货币网络处理能力的度量单位,表示cpu计算哈希函数输出的速度,矿池算力作为评价实际运算工作量的数据指标,与挖矿实际获得的收益相关,并通常认为虚拟货币比价会影响算力,因为币价上涨时,矿工的利润增长,会购买更多的矿机,新矿机算力高,数量越多,导致虚拟货币总体算力上涨。
27.在此基础上,可以使用用户日电量y与地区中矿池算力波动q之间的相关性,在疑似用户清单中,进一步缩小疑似挖矿用户的标记范围,实现精准判定的同时,提高识别效率,具体包括:若用户所在地区的运营商对dns服务器启动域名混淆,则计算域名混淆前后的矿池算力差值;获取疑似挖矿用户的日用电量,计算用户的日用电量与矿池算力差值之间的皮尔逊相关系数为:
其中,li表示第i个用户的日用电量与矿池算力之间的皮尔逊相关系数,表示第i个用户在第j天的日用电量,表示第i个用户在n天内的日平均用电量,qj表示第j天的矿池算力差值,表示n天内平均矿池算力差值;根据li对疑似挖矿用户进行进一步缩小范围,将li小于预设值的疑似挖矿用户去除标记。
28.在本实施例中,通过对疑似挖矿用户的用电数据进行进一步特征分析,以对疑似挖矿用户进行进一步精确分析,具体为分别计算疑似挖矿用户的用电量标准差结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值,包括:将用户的用电量标准差和月均用电量的比值作为特征值中的第一特征值,即的值越小,认为用户i的用电负荷越平稳,挖矿的可能性越大,的值越大,认为用户i的用电负荷变化越大,挖矿的可能性越小;将用户的用电量标准差与月用电运行容量的比值作为特征值中的第二特征值,即物理含义与类似,从运行容量角度考察用户i挖矿可能性大小,用户根据自身用电需求确定运行容量,当用电量远大于对应运行容量的一般用电量时,认为该用户的挖矿可能性较大;将用户的月均用电量与月用电运行容量的比值作为特征值中的第三特征值,即一般情况下挖矿行为会使用户月均用电量异常增大,偏离运行容量对应的用电量范围,的值越大,认为用户i的用电量异常增大情况越严重,挖矿的可能性越大,的值越小,则认为用户i的挖矿可能性越小;计算用户的用电量与虚拟货币价格之间的皮尔逊相关系数,所述皮尔逊相关系数的计算过程包括:
其中,ri表示皮尔逊相关系数,表示第i位用户前第j个月的月电量,表示用户前n个月的月均用电量,pj表示虚拟货币在前第j个月的月均价格,表示虚拟货币在前n个月的平均价格;最终,将所述皮尔逊相关系数作为第四特征值,本实施例中判定币价越高,用户挖矿的意愿越高,体现在用电量上即ri的值越大,挖矿可能性也就越大。
29.因各地经济发展情况不同、用户用电类别不同等原因,直接给定固定的指标阈值不利于识别可疑的挖矿用户,所以本实施例考察所有上述特征值的分布情况来确定对应的第二阈值,具体包括:分别绘制第一特征值、第二特征值、第三特征值的频次直方图,确定频次直方图近似满足的概率分布类型,在本实施例中,所述概率分布类型包括正态分布和卡方分布;分别根据第一特征值、第二特征值、第三特征值近似满足的概率分布类型,确定用于确定阈值分位数,将所述阈值分位数上的数值作为对应第一特征值、第二特征值、第三特征值的第二阈值;将对应第四特征值的第二阈值设置为人工经验设定的定值。
30.在本实施例中,用电量标准差/月均电量频次图近似满足正态分布,所以可根据分位数的前10%,确定异常阈值;月均电量/运行容量频次图近似满足卡方分布,所以可根据其单侧的10%,确定异常阈值;用电量标准差/运行容量频次图近似满足卡方分布,所以可根据其单侧的10%,确定异常阈值;由于第四特征值为相关系数,因此可设置定值0.9作为异常阈值。在此基础上,得到疑似挖矿用户的一次筛选条件为:其中任意两项及以上时认为,该用户存在挖矿行为的可能性非常高。
31.本实施例中考虑到一些特定用户的特殊用电可能会对挖矿行为的判定造成一定干扰,因此,需要根据用户户名对识别结果进行二次筛选,包括根据户名剔除特殊用电用户,所述特殊用电用户包括通信运营商、铁塔公司、农村经济合作社、物业公司以及建筑公司这些用电量大且负荷稳定的用户,剔除后剩余的用户即标记为存在挖矿行为的用户。
32.在本实施例中,所述用户户名可通过调用电网公司业务营销云平台的数据进行抓取,通过与用户户名绑定的用户分类代码进行上述二次筛选。
33.上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。
34.以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于用电负荷的挖矿行为识别方法,其特征在于,所述挖矿行为识别方法包括:获取用户在一定时段的月用电量数据和月用电运行容量,计算用户在所述时段期间的月均用电量,将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户;分别计算疑似挖矿用户的用电量标准差,结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值;根据各个用户的所述特征值的概率分布情况,分别确定各个特征值的第二阈值,根据第二阈值在疑似挖矿用户中进行一次筛选;根据用户户名对一次筛选出的疑似挖矿用户进行二次筛选,将二次筛选出的用户标记为存在挖矿行为的用户。2.根据权利要求1所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,所述第一阈值的设置为用户所在地区中月均用电总量的3倍。3.根据权利要求所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,所述分别计算疑似挖矿用户的用电量标准差,结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值,包括:将用户的用电量标准差和月均用电量的比值作为特征值中的第一特征值;将用户的用电量标准差与月用电运行容量的比值作为特征值中的第二特征值;将用户的月均用电量与月用电运行容量的比值作为特征值中的第三特征值;计算用户的用电量与虚拟货币价格之间的皮尔逊相关系数,将所述皮尔逊相关系数作为第四特征值。4.根据权利要求3所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,所述皮尔逊相关系数的计算过程包括:其中,r
i
表示皮尔逊相关系数,表示第i位用户前第j个月的月电量,表示用户前n个月的月均用电量,p
j
表示虚拟货币在前第j个月的月均价格,表示虚拟货币在前n个月的平均价格。5.根据权利要求3所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,所述根据各个用户的所述特征值的概率分布情况,分别确定各个特征值的第二阈值,包括:分别绘制第一特征值、第二特征值、第三特征值的频次直方图,确定频次直方图近似满足的概率分布类型;分别根据第一特征值、第二特征值、第三特征值近似满足的概率分布类型,确定用于确定阈值分位数,将所述阈值分位数上的数值作为对应第一特征值、第二特征值、第三特征值的第二阈值;将对应第四特征值的第二阈值设置为人工经验设定的定值。
6.根据权利要求5所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,所述概率分布类型包括正态分布和卡方分布。7.根据权利要求1所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,所述根据用户户名对一次筛选出的疑似挖矿用户进行二次筛选,将二次筛选出的用户标记为存在挖矿行为的用户,包括:根据户名剔除特殊用电用户,所述特殊用电用户包括通信运营商、铁塔公司、农村经济合作社、物业公司以及建筑公司。8.根据权利要求1所述的一种基于用电负荷的挖矿行为识别方法,其特征在于,在将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户之后,所述挖矿行为识别方法还包括:若用户所在地区的运营商对dns服务器启动域名混淆,则计算域名混淆前后的矿池算力差值;获取疑似挖矿用户的日用电量,计算用户的日用电量与矿池算力差值之间的皮尔逊相关系数为:其中,l
i
表示第i个用户的日用电量与矿池算力之间的皮尔逊相关系数,表示第i个用户在第j天的日用电量,表示第i个用户在n天内的日平均用电量,q
j
表示第j天的矿池算力差值,表示n天内平均矿池算力差值;根据l
i
对疑似挖矿用户进行进一步缩小范围,将l
i
小于预设值的疑似挖矿用户去除标记。

技术总结
本发明提出了一种基于用电负荷的挖矿行为识别方法,包括:获取用户的月用电量数据和月用电运行容量,计算用户的月均用电量,将月均用电量超过预设的第一阈值的用户标记为疑似挖矿用户;分别计算疑似挖矿用户的用电量标准差,结合月均用电量、月用电运行容量对挖矿行为进行特征分析,得到用于挖矿行为识别的特征值;根据各个用户的所述特征值的概率分布情况,分别确定各个特征值的第二阈值,根据第二阈值在疑似挖矿用户中进行一次筛选;根据用户户名对一次筛选出的疑似挖矿用户进行二次筛选,将二次筛选出的用户标记为存在挖矿行为的用户。本发明提高了识别方法的适用性以及准确性,进而基于识别结果对相关人员的行为进行限电、警告等打击措施。警告等打击措施。警告等打击措施。


技术研发人员:宣羿 杨霖泽 樊立波 张旭东 孙智卿 韩荣杰 屠永伟 向新宇 黄佳斌 蒋建 陈益芳 来益博 金旻昊 张建松 沈思琪 王亿 方响 王奇锋
受保护的技术使用者:国网浙江省电力有限公司
技术研发日:2022.05.18
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-5730.html

最新回复(0)