基于局部多层次比特币交易图的特征提取方法及系统与流程

专利2024-11-28  61



1.本发明涉及比特币领域,特别是涉及一种基于局部多层次比特币交易图的 比特币地址特征提取方法及系统。


背景技术:

2.区块链网络,尤其是比特币和以太坊等密码货币,具有去中心化交易的能 力,因而交易记录受密码学签名机制的保护,具有完全自主确定,无法更改, 且交易记录在账本中能得到公开被承认,因此,密码货币在不受资金监管的领 域(例如冻结资金是不可能的)。由于比特币中账户是匿名的,很多特殊交易为 了躲避监管,也采用比特币等密码货币。如何通过对区块链的交易行为进行分 析,并进行账户的监管是一项重要的研究课题。
3.现如今的交易图(也可称为交易网络)的构建方法较为简单,导致大量的 信息损失,例如没有保留交易节点,只保留了账户节点,将交易信息收缩到账 户里表示,导致交易信息的损失。
4.对交易行为的分析采取的方法一般是:1)下载区块链交易账本数据;2) 将数据解析,获得多层次的比特币图数据;3)分析图数据,得到分析结果。目 前的难点在于第3步,图数据如何分析,需要提出一些合适的指标,这些指标 能够刻画特殊的交易行为,这将有利于对区块链交易行为的监管。
5.现有技术在交易网络中提取特征方法较为简单,刻画效果不好,导致特征 的可用性不强,造成分类结果的效果不佳,影响对于区块链交易的分析,以及 异常交易行为的检测。且现有技术并未考虑到复杂统计特征和局部结构特征, 同时也没有考虑到二者结合对交易图的构建分析,来实现交易的分析特征的提 取。同时由于区块链交易图非常巨大,对整个图进行分析较为困难,响应时间 上不具有可行性。


技术实现要素:

6.本发明主要目的在于提供一种基于局部多层次比特币交易图的特征提取方 法及系统,可以最大程度保留原始交易特征,提高特征提取效率。
7.本发明所采用的技术方案是:
8.提供一种基于局部多层次比特币交易图的特征提取方法,包括以下步骤:
9.构建有向异构多重图,包括区块层、交易层和账户层,区块层包含区块节 点,用于保存区块的信息,当两个区块节点相连时代表其包含的交易之间有比 特币流动;交易层包含交易节点,用于保存交易的信息,当两个交易节点相连 时代表一笔交易的输出在另一笔交易中为输入,交易节点都有对应的一个区块 节点,对应关系为交易所在的区块;账户层包含账户节点,用于保存账户的信 息,当两个账户节点相连时,代表这两个账户之间存在至少一笔交易,账户节 点都至少有对应的一个交易节点,对应关系为账户所进行的交易;
10.构建比特币交易图,逐个文件读取,获取所有原始账本的数据文件,将数 据文件中的所有数据添加进构建好的有向异构多重图,生成完整的比特币交易 图;
11.将比特币交易图中的区块节点、交易节点与账户节点建立包含映射关系的 索引表;
12.根据待提取统计特征的地址,通过索引表在比特币交易图中进行查询,获 取相应地址节点相关边上的交易信息。
13.接上述技术方案,有向异构多重图的每个图层中存在的边均为有向边且允 许平行边,同时允许跨图层的边,用于保存账户与交易之间的拓扑结构和交易 与区块之间的拓扑结构。
14.接上述技术方案,构建比特币交易图时具体将地址节点与交易节点之间的 金额流动作为边添加进图中,使得边同样具有属性,包括金额流动大小,发生 时间与流动方向。
15.接上述技术方案,获取所有原始账本的数据文件时,具体抽象出区块、交 易和地址三种对象来对应有向异构多重图中的区块节点,交易节点和地址节点, 同种节点通过区块哈希值、交易哈希值或者地址哈希值进行区分。
16.接上述技术方案,提取的相应地址节点相关边上的交易信息包括流量信息、 邻居节点的交易时间、节点的度、交易频率。
17.接上述技术方案,所有对比特币交易图中节点的访问均经过索引表进行。
18.本发明还提供了一种基于局部多层次比特币交易图的特征提取系统,包括:
19.有向异构多重图构建模块,用于构建有向异构多重图,包括区块层、交易 层和账户层,区块层包含区块节点,用于保存区块的信息,当两个区块节点相 连时代表其包含的交易之间有比特币流动;交易层包含交易节点,用于保存交 易的信息,当两个交易节点相连时代表一笔交易的输出在另一笔交易中为输入, 交易节点都有对应的一个区块节点,对应关系为交易所在的区块;账户层包含 账户节点,用于保存账户的信息,当两个账户节点相连时,代表这两个账户之 间存在至少一笔交易,账户节点都至少有对应的一个交易节点,对应关系为账 户所进行的交易;
20.比特币交易图构建模块,用于构建比特币交易图,逐个文件读取,获取所 有原始账本的数据文件,将数据文件中的所有数据添加进构建好的有向异构多 重图,生成完整的比特币交易图;
21.索引表生成模块,用于将比特币交易图中的区块节点、交易节点与账户节 点建立包含映射关系的索引表;
22.特征提取模块,用于根据待提取统计特征的地址,通过索引表在比特币交 易图中进行查询,获取相应地址节点相关边上的交易信息。
23.接上述技术方案,提取的相应地址节点相关边上的交易信息包括流量信息、 邻居节点的交易时间、节点的度、交易频率。
24.接上述技术方案,有向异构多重图的每个图层中存在的边均为有向边且允 许平行边,同时允许跨图层的边,用于保存账户与交易之间的拓扑结构和交易 与区块之间的拓扑结构。
25.接上述技术方案,构建比特币交易图时具体将地址节点与交易节点之间的 金额流动作为边添加进图中,使得边同样具有属性,包括金额流动大小,发生 时间与流动方向。
26.接上述技术方案,特征提取模块具体通过复杂统计特征提取和局部结构特 征提取获取相应地址节点相关边上的交易信息;
27.复杂统计特征提取是基于统计分析以及相关金融领域经验模型,对于需要 提取统计特征的地址,通过索引表在交易图中进行查询,获取相关地址节点相 关边上的流量信息、邻居节点的交易时间、统计节点的度、交易频率信息,根 据基础的统计信息以及通过包括金额、度、时间统计信息的结合,进行进一步 的复杂的统计分析,获取对应的复杂统计指标;
28.局部结构特征提取是对某一节点生成以其为中心的n环子图,再根据各种 图结构指标的计算方法对n环子图进行计算,获取对应的特征;n环子图生成 过程为:找到与中心节点距离n以内的所有节点;将这些节点与中心节点,每 对节点之间存在的边一并复制到一个新的交易图中,即子图。
29.接上述技术方案,所有对比特币交易图中节点的访问均经过索引表进行。
30.本发明还提供了一种计算机存储介质,其内存储有可被处理器执行的计算 机程序,该计算机程序执行接上述技术方案的基于局部多层次比特币交易图的 特征提取方法。
31.本发明产生的有益效果是:本发明通过有向异构多重图构建三层比特币交 易图,包括区块层、交易层和地址层三个角度记录原始比特币交易信息,且三 层之间相互关联,使得比特币交易图中的边同样具有属性,包括金额流动大小, 发生时间与流动方向,并通过建立索引表进行交易特征提取,从而最大程度上 保留了原始比特币交易的结构特点,并且从相距较远的节点之间影响力较小的 角度出发,本发明突破性的仅仅对某一节点的子图通过索引表进行特征提取, 在基本不损失节点特征的同时,大大加快了提取特征的效率。本发明同时也从 拓扑结构、时间和流量三个角度提出了一系列可以鲜明刻画交易行为特点的特 征指标,通过这些特征指标可以有效的反应交易图中节点的行为特点,从而达 到对区块链交易行为的监管。
附图说明
32.下面将结合附图及实施例对本发明作进一步说明,附图中:
33.图1是本发明实施例基于局部多层次比特币图的比特币地址特征提取方法 的流程图;
34.图2是本发明实施例构建的多层次的异构有向多重比特币交易图;
35.图3是本发明实施例基于局部比特币交易图的比特币地址特征提取方法框 架图。
具体实施方式
36.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅 用以解释本发明,并不用于限定本发明。
37.本发明提出了的基于局部多层次比特币图的比特币地址特征提取方法,首 先需要构建局部多层次比特币交易图构建,其次通过特征提取如复杂统计特征 和局部结构特征提取交易图的信息。局部比特币交易图构建方法不需要构建整 个比特币交易图,而只是需要选择任意区块链时间区间或者区块头范围内的连 续区块构成比特币图(也就是输入交易时间区间,例如2022年2月1日到2022 年2月28日,或者输入区块链区块头的id区间,例如第20000区块到21000 区块),为了最大程度保留原始交易特征,图的构建分为多个图层,
代表区块相 关特征的区块层,代表交易相关的特征的交易层,与代表地址相关特征的地址 层(注意,这里的图与现有技术提出的图是不同的,本发明的图是保留了所有 的比特币数据信息,目前现有技术中的图是部分比特币数据信息),也就是本专 利的图是根据比特币账本数据结构构成的,该图中,区块层有区块构成的节点, 交易层有交易构成的节点,地址层有地址构成的节点;而现有技术中的图是根 据地址构成的,节点只有地址节点)。
38.本发明实施例基于局部多层次比特币交易图的特征提取方法,如图1所示, 主要包括以下步骤:
39.s1、构建有向异构多重图,包括区块层、交易层和账户层,区块层包含区 块节点,用于保存区块的信息,当两个区块节点相连时代表其包含的交易之间 有比特币流动;交易层包含交易节点,用于保存交易的信息,当两个交易节点 相连时代表一笔交易的输出在另一笔交易中为输入,交易节点都有对应的一个 区块节点,对应关系为交易所在的区块;账户层包含账户节点,用于保存账户 的信息,当两个账户节点相连时,代表这两个账户之间存在至少一笔交易,账 户节点都至少有对应的一个交易节点,对应关系为账户所进行的交易;
40.s2、构建比特币交易图,逐个文件读取,获取所有原始账本的数据文件, 将数据文件中的所有数据添加进构建好的有向异构多重图,生成完整的比特币 交易图,如图2所示。
41.s3、将比特币交易图中的区块节点、交易节点与账户节点建立包含映射关 系的索引表;
42.s4、根据待提取统计特征的地址,通过索引表在比特币交易图中进行查询, 获取相应地址节点相关边上的交易信息。
43.具体地,步骤s1和s2中,原始的交易数据中仅仅记录了每次交易的的信 息,直接从中读取信息提取的特征无法涵盖更加深刻的图角度上的特征。故需 要为比特币数据设计的图结构,由于比特币中的交易拓扑模型有:一对一、一 对多、多对一、多对多与自己找钱,为了清楚的表达这几种不同的交易模型, 尽可能的减小图构建过程中的信息损失,本发明生成图的类型采用为多层次的 有向异构多重图(而其他方法中的图类型为只有地址节点的同构图,损失的信 息更多)。其含义为:存在三个图层,每个图层中存在的边为有向边且允许平行 边,同时允许跨图层的边来记录其他信息,例如地址-交易边代表了某个地址出 现在某个交易中,交易-区块边代表了某个交易出现在某个区块中,其分别保存 了地址与交易之间的拓扑结构和交易与区块之间的拓扑结构。三个图层中的节 点为区块节点,交易节点和地址节点三种节点。
44.其中各个图层的结构与信息如下:
45.区块层:包含了区块节点,保存了区块的信息例如区块哈希值,高度,产 生时间,难度值,交易数量等等。当两个区块节点相连时代表其包含的交易之 间有比特币流动。
46.交易层:包含了交易节点,保存了交易的信息例如交易哈希值,所在区块 高度,产生时间,输入/输出金额等等。当两个交易节点相连时代表一笔交易的 输出在另一笔交易中为输入。交易节点都有对应的一个区块节点,对应关系为 交易所在的区块。
47.地址层:包含了地址节点,保存了地址的信息例如地址哈希值,地址进行 的交易数量,地址的活跃时间等等。当两个地址节点相连时,代表这两个地址 之间存在至少一笔交易。地址节点都至少有对应的一个交易节点,对应关系为 地址所进行的交易。
48.再将比特币区块链中原始的交易账本作为输入(根据包含的时间区间参数 或者区块头区间参数,或者根据某个地址的哈希地址进行检索),利用自主编写 的读取代码进行对原始的账本记录进行读取,逐文件的解析并添加新的比特币 交易与地址,最终通过库函数生成完整的局部比特币交易图。
49.具体来说,为了生成多层次的比特币交易图,其为包含区块节点,交易节 点和地址节点的多层次有向异构多重图,需要从比特币区块链中的原始账本数 据抽象出区块,交易和地址三种对象来对应图中的区块节点,交易节点和地址 节点,之后为了区分同种对象节点,需要用抽象出的区块,交易与地址中一一 对应的区块哈希值,交易哈希值与地址哈希值(此属性值是唯一的,原始数据 现有的)作为区块节点,交易节点与地址节点的唯一标识。
50.除了区分同种对象节点而使用的交易哈希属性与地址属性之外,抽象出的 区块,交易和地址节点中还包括了大量的信息,包括(不仅限于):输入/出数 量、各输入/出金额、输入/出总金额、交易发生时间、所在区块高度、地址相 关交易数量和交易手续费等等。这些信息都会在生成图的过程中被添加进相对 应的节点内。
51.接下来系统会逐文件的读取所有原始账本数据文件,按照上述的思路,将 抽象出的,包含了相对应的属性的,区块,交易和地址三种对象,添加进图中 作为区块,交易与地址节点。同时,将地址节点与交易节点之间的金额流动作 为边添加进图中,边同样也有属性,例如金额流动的金额大小,发生时间与流 动方向。这是其他方法中所没有的。
52.按上步骤完成交易图的完整生成后,为了加速对图中节点的查询,需要对 图中的区块节点,交易节点与地址节点建立包含映射关系的索引表。其索引表 内保存的关系为节点的唯一标识(区块哈希值,交易哈希值,地址值)对应其 在交易图中的节点,这一键值关系。所有对节点的访问必须经过索引表进行, 即对交易图的节点查询需要先通过索引表中的这一键值关系进行,例如知道某 一地址节点的唯一标识,即可通过索引表查询到其在交易图中的地址节点。
53.步骤s4中,获取相应地址节点相关边上的交易信息即比特币地址特征提取, 主要分为两个部分,分别是复杂统计特征提取和局部结构特征提取,如图3所 示。
54.复杂统计特征提取主要通过使用传统金融领域在不正当经济犯罪等领域的 分析模型,将传统经济领域的对于交易网络的复杂统计分析方法与区块链交易 网络图进行结合,充分体现比特币地址的交易特征。局部结构特征提取方法对 需要进行查询的比特币地址节点生成n环子图(注意,这里n是参数,也就是 观察n次交易后的连接图,n环是指从某个节点出发,走n步以内,也就是沿 着图的边走到第i个节点,i小于等于n),并对其生成的子图的结构特性进行 特征提取。这两种特征提取方法都能够有效的提取具有高价值与高可用性的特 征,以用于分析。
55.具体地,复杂统计特征提取:基于统计分析以及相关金融领域经验模型等, 对于需要提取统计特征的地址,在通过索引表在交易图中进行查询,获取相关 地址节点相关边上的流量信息、邻居节点的交易时间、统计节点的度、交易频 率等信息,根据基础的统计信息,通过金额、度、时间等统计信息的结合,进 行进一步的复杂的统计分析,获取其对应的复杂统计指标。但是需要注意的是, 因为人们通常关注于地址背后所关联的实体的相关信息,所以本发明法是针对 于比特币地址节点进行特征提取。
56.具体提取方法如下:
57.①
f1——金额+度
58.f1-1:地址节点输入/输出总金额和入度/出度的比值(出度为地址节点 在图中作为有向边的起点的次数,入度为地址节点在图中作为有向边的终点 的次数)。
59.f1-2:地址节点输入金额和输出金额的差值与入度和出度的差值的比值。
60.②
f2——金额+时间
61.f2-1:活跃天数(地址节点当天发生交易,则记当天为活跃天数)。
62.f2-2:生命周期(地址节点第一次发生交易到最后一次交易之间的周期 记为生命周期)。
63.f2-3:计算活跃天数内地址节点在每一天的平均输入/输出金额。
64.f2-4:计算地址节点在活跃周期内单日输入/输出金额的最大值/最小值。
65.f2-5:计算地址节点活跃天数中每一天的输入/输出总金额与生命周期的 比值的平均值/最大值/最小值。
66.f2-6:计算地址节点活跃天数中每一天的输入/输出总金额与生命周期的 比值的标准差。
67.f2-7:计算地址节点输入/输出总金额的变化值与交易时间的比值的平均 值/最大值/最小值。
68.f2-8:计算地址节点输入/输出总金额的变化值与交易时间的比值的标准 差。
69.③
f3——度+时间
70.f3-1:计算地址节点在活跃天数中每一天的全部/出度的平均值/最大值/ 最小值。
71.f3-2:计算地址节点在活跃天数中每一天的全部入度/出度/总度和生命 周期的比值的平均值/最大值/最小值。
72.f3-3:计算地址节点在活跃天数中每一天的全部入度/出度/总度和生命 周期的比值的标准差。
73.f3-4:计算节点出度与入度的改变值和交易时间间隔的比值的平均值/最 大值/最小值。
74.f3-5:计算节点出度与入度的改变值和交易时间间隔的比值的标准差。
75.④
f4——金额+度+时间
76.f4-1:计算地址节点在活跃天数中输入总金额和入度的比值的和与地址 生命周期的比值的平均值/最大值/最小值。
77.f4-2:计算地址节点在活跃天数中输入总金额和入度的比值的和与地址 生命周期的比值的标准差。
78.f4-3:计算地址节点在活跃天数中输入总金额和出度的比值的和与地址 生命周期的比值的平均值/最大值/最小值。
79.f4-4:计算地址节点在活跃天数中输入总金额和出度的比值的和与地址 生命周期的比值的标准差。
80.f4-5:计算地址节点输入总金额和入度的比值的改变值与交易时间间隔 的比值的平均值/最大值/最小值。
81.f4-6:计算地址节点输入总金额和入度的比值的改变值与交易时间间隔 的比值的标准差。
82.f4-7:计算地址节点输入总金额和出度的比值的改变值与交易时间间隔 的比值的平均值/最大值/最小值。
83.f4-8:计算地址节点输入总金额和出度的比值的改变值与交易时间间隔 的比值的标准差。
84.局部结构特征提取:由于比特币交易图过于庞大,对全图统计图结构指标 的耗时过长,而距离较远的两节点之间的影响力又较小,故可以对某一节点生 成以其为中心的n环子图。n环子图生成方式有两步:
85.a.找到与中心节点距离n以内的所有节点;
86.b.将这些节点与中心节点,每对节点之间存在的边一并复制到一个新的 交易图中,即子图。
87.对通过生成的子图,对子图根据各种图结构指标的计算方法,对子图进行 计算,获取其对应的特征,其中cn表示n环子图。具体提取方法如下:
88.①
度平均值的倒数——描述了图中度的平均水平:
[0089][0090]
是地址节点的数量,是交易节点的数量,aa是地址节点的度,而tb是 交易节点的度。
[0091]

度相关性的倒数的开方——描述了图中度大的节点和度小的节点之间的 关系:
[0092][0093]
其中da和db分别表示边e
ab
的两个节点nodea和nodea的度,e表示cn的 中的总边数。
[0094]

节点介数的倒数的平方——描述了节点在在图中的作用以及影响力:
[0095][0096]
其中是节点nodea和节点nodeb之间的最短路径,表示在节点 nodeb和节点nodeb之间的通过节点nodec的最短路径的个数,
[0097]

平均路径长度的倒数:
[0098]
[0099]
l
ab
是指节点nodeb与节点nodeb之间的距离,是地址节点的数量,是 交易节点的数量。
[0100]

紧密中心性的平方——描述了一个节点到所有其他节点的紧密程度:
[0101][0102]
n是cn中的节点总个数,l
min
(a,b)是nodea与节点nodeb之间的最短路径 距离。nodea是需要计算的节点。
[0103]

图密度的三次方——描述了图的稀疏程度:
[0104][0105]
e是cn中所有边的总数,是地址节点的数量,是交易节点的数量。
[0106]

图最大直径的倒数——描述图中两个顶点间距离的最大值:
[0107][0108]
l
max
(a,b)是cn中任意节点nodea与任意节点nodeb之间的最长。
[0109]
本发明实施例基于局部多层次比特币交易图的特征提取系统主要用于实现 上述方法实施例,该系统包括:
[0110]
有向异构多重图构建模块,用于构建有向异构多重图,包括区块层、交易 层和账户层,区块层包含区块节点,用于保存区块的信息,当两个区块节点相 连时代表其包含的交易之间有比特币流动;交易层包含交易节点,用于保存交 易的信息,当两个交易节点相连时代表一笔交易的输出在另一笔交易中为输入, 交易节点都有对应的一个区块节点,对应关系为交易所在的区块;账户层包含 账户节点,用于保存账户的信息,当两个账户节点相连时,代表这两个账户之 间存在至少一笔交易,账户节点都至少有对应的一个交易节点,对应关系为账 户所进行的交易;
[0111]
比特币交易图构建模块,用于构建比特币交易图,逐个文件读取,获取所 有原始账本的数据文件,将数据文件中的所有数据添加进构建好的有向异构多 重图,生成完整的比特币交易图;
[0112]
索引表生成模块,用于将比特币交易图中的区块节点、交易节点与账户节 点建立包含映射关系的索引表;
[0113]
特征提取模块,用于根据待提取统计特征的地址,通过索引表在比特币交 易图中进行查询,获取相应地址节点相关边上的交易信息。
[0114]
各个模块也是用于实现上述方法实施例的步骤,在此不赘述。
[0115]
本发明还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型 存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访 问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器 (eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务 器、app应用商城等等,其上存储有计算机程序,程序被处理器执行时实现
相 应功能。本实施例的计算机可读存储介质用于被处理器执行时实现方法实施例 的基于局部多层次比特币交易图的特征提取方法。
[0116]
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进 或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

技术特征:
1.一种基于局部多层次比特币交易图的特征提取方法,其特征在于,包括以下步骤:构建有向异构多重图,包括区块层、交易层和账户层,区块层包含区块节点,用于保存区块的信息,当两个区块节点相连时代表其包含的交易之间有比特币流动;交易层包含交易节点,用于保存交易的信息,当两个交易节点相连时代表一笔交易的输出在另一笔交易中为输入,交易节点都有对应的一个区块节点,对应关系为交易所在的区块;账户层包含账户节点,用于保存账户的信息,当两个账户节点相连时,代表这两个账户之间存在至少一笔交易,账户节点都至少有对应的一个交易节点,对应关系为账户所进行的交易;构建比特币交易图,逐个文件读取,获取所有原始账本的数据文件,将数据文件中的所有数据添加进构建好的有向异构多重图,生成完整的比特币交易图;将比特币交易图中的区块节点、交易节点与账户节点建立包含映射关系的索引表;根据待提取统计特征的地址,通过索引表在比特币交易图中进行查询,获取相应地址节点相关边上的交易信息。2.根据权利要求1所述的基于局部多层次比特币交易图的特征提取方法,其特征在于,有向异构多重图的每个图层中存在的边均为有向边且允许平行边,同时允许跨图层的边,用于保存账户与交易之间的拓扑结构和交易与区块之间的拓扑结构。3.根据权利要求1所述的基于局部多层次比特币交易图的特征提取方法,其特征在于,构建比特币交易图时具体将地址节点与交易节点之间的金额流动作为边添加进图中,使得边同样具有属性,包括金额流动大小,发生时间与流动方向。4.根据权利要求1所述的基于局部多层次比特币交易图的特征提取方法,其特征在于,获取所有原始账本的数据文件时,具体抽象出区块、交易和地址三种对象来对应有向异构多重图中的区块节点,交易节点和地址节点,同种节点通过区块哈希值、交易哈希值或者地址哈希值进行区分。5.根据权利要求1所述的基于局部多层次比特币交易图的特征提取方法,其特征在于,提取的相应地址节点相关边上的交易信息包括流量信息、邻居节点的交易时间、节点的度、交易频率。6.一种基于局部多层次比特币交易图的特征提取系统,其特征在于,包括:有向异构多重图构建模块,用于构建有向异构多重图,包括区块层、交易层和账户层,区块层包含区块节点,用于保存区块的信息,当两个区块节点相连时代表其包含的交易之间有比特币流动;交易层包含交易节点,用于保存交易的信息,当两个交易节点相连时代表一笔交易的输出在另一笔交易中为输入,交易节点都有对应的一个区块节点,对应关系为交易所在的区块;账户层包含账户节点,用于保存账户的信息,当两个账户节点相连时,代表这两个账户之间存在至少一笔交易,账户节点都至少有对应的一个交易节点,对应关系为账户所进行的交易;比特币交易图构建模块,用于构建比特币交易图,逐个文件读取,获取所有原始账本的数据文件,将数据文件中的所有数据添加进构建好的有向异构多重图,生成完整的比特币交易图;索引表生成模块,用于将比特币交易图中的区块节点、交易节点与账户节点建立包含映射关系的索引表;特征提取模块,用于根据待提取统计特征的地址,通过索引表在比特币交易图中进行
查询,获取相应地址节点相关边上的交易信息。7.根据权利要求6所述的基于局部多层次比特币交易图的特征提取系统,其特征在于,提取的相应地址节点相关边上的交易信息包括流量信息、邻居节点的交易时间、节点的度、交易频率。8.根据权利要求6所述的基于局部多层次比特币交易图的特征提取系统,其特征在于,有向异构多重图的每个图层中存在的边均为有向边且允许平行边,同时允许跨图层的边,用于保存账户与交易之间的拓扑结构和交易与区块之间的拓扑结构。9.根据权利要求6所述的基于局部多层次比特币交易图的特征提取系统,其特征在于,构建比特币交易图时具体将地址节点与交易节点之间的金额流动作为边添加进图中,使得边同样具有属性,包括金额流动大小,发生时间与流动方向。10.根据权利要求6所述的基于局部多层次比特币交易图的特征提取系统,其特征在于,特征提取模块具体通过复杂统计特征提取和局部结构特征提取获取相应地址节点相关边上的交易信息;复杂统计特征提取是基于统计分析以及相关金融领域经验模型,对于需要提取统计特征的地址,通过索引表在交易图中进行查询,获取相关地址节点相关边上的流量信息、邻居节点的交易时间、统计节点的度、交易频率信息,根据基础的统计信息以及通过包括金额、度、时间统计信息的结合,进行进一步的复杂的统计分析,获取对应的复杂统计指标;局部结构特征提取是对某一节点生成以其为中心的n环子图,再根据各种图结构指标的计算方法对n环子图进行计算,获取对应的特征;n环子图生成过程为:找到与中心节点距离n以内的所有节点;将这些节点与中心节点,每对节点之间存在的边一并复制到一个新的交易图中,即子图。

技术总结
本发明公开了一种基于局部多层次比特币交易图的特征提取方法,包括以下步骤:构建有向异构多重图,包括区块层、交易层和账户层;构建比特币交易图,逐个文件读取,获取所有原始账本的数据文件,将数据文件中的所有数据添加进构建好的有向异构多重图,生成完整的比特币交易图;将比特币交易图中的区块节点、交易节点与账户节点建立包含映射关系的索引表;根据待提取统计特征的地址,通过索引表在比特币交易图中进行查询,获取相应地址节点相关边上的交易信息。本发明可以提高比特币地址节点特征提取效率。提取效率。提取效率。


技术研发人员:任伟 刘文懋 鲍鼎
受保护的技术使用者:绿盟科技集团股份有限公司
技术研发日:2022.06.29
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-10568.html

最新回复(0)