一种基于区块链的农业众包知识图谱构建方法及系统

专利2025-01-07  22



1.本发明属于知识图谱构建技术领域,特别涉及一种基于区块链的农业众包知识图谱的构建方法及系统。


背景技术:

2.近年来,随着对于领域知识图谱的需求逐渐加深,也诞生了例如 openkg.cn的领域知识图谱构建平台,涉及农业、气象、娱乐、海洋等诸多领域。除了大型平台以外,还有许多学者针对细节领域知识图谱的构建进行了研究。chen y等人研究并构建了农业知识图谱,并将之运用到农业实体检索和农业问答。
3.众包是一种将集体智慧通过外包的方式实现某种目标的工作形式,是一种开源开放的模式,任务可以由任何机构或个人发布,不受雇佣合同和物理空间的限制,就将任务交到解决方案商的手里。发布众包任务的机构需要将一个任务分包为多个子任务,并通过算法分配到合适的解决方案方来完成任务。解决方案方无需繁杂的资质审核,通过对众包标注的数据进行质量评估评价,体现工作能力和工作价值。在传统的众包任务中,众包任务的形式和要求通常较为单一、评价标准较低,但需要的工人数量相对较多。在移动互联网时代,将此类用工需求大、知识门槛较低的任务辅以众包的方式使问题得到快速解决。但在领域知识图谱构建中,需要众包构建者具有相关专业领域的知识。
4.经典的众包知识图谱挖掘系统tpho、higgins、hike、crowdec,从自然语言中抽取相关实体和三元组,直接完成知识图谱构建。但此类系统参与构建的用户自己知识水平参差不齐,导致最终构建的整体质量不高,构建效率低,同时众包过程中的数据存在泄露及被篡改的风险,故障数据难以追踪追溯,数据的可信度不高。


技术实现要素:

5.针对现有农业知识图谱构建中的构建数据质量差、构建效率低、质量难评估、数据易泄露、可信度低等问题,本发明提供了一种基于区块链的农业众包知识图谱的构建方法及系统。
6.为了实现上述技术效果,本发明采用了以下技术方案:
7.本发明的第一方面提供了一种基于区块链的农业众包知识图谱构建方法,包括以下步骤:
8.s1、构建农业知识图谱初始数据库:获取农业知识图谱初始数据,包括已有的农业知识图谱、农业专家收集的图谱资源和农业领域专业机构公开数据资源,将三者组合形成基础农业数据三元组,并存储到图数据库,构建农业知识图谱初始数据库;
9.s2、融合区块链智能合约的众包平台架构,获取众包任务数据,并上传至区块链:采用智能合约技术在区块链上实现与部署众包工作流程,设计任务发布函数、任务分配函数以及任务质量评估函数,采取智能合约同时协约,获得众包任务可信任的答案,并将实施过程和众包任务可信任的答案作为众包任务数据上传至区块链;
10.s3、获取三元组数据:对步骤s2得到的任务答案数据进行命名实体识别、以及对属性关系的联合抽取,获取三元组数据,然后存储到步骤s1构建的农业知识图谱初始数据库中;
11.s4、知识融合:将步骤s3获得的三元组数据合并到步骤s1构建的图数据库,同时分别对模式层和数据层进行融合;对模式层的融合为处理新得到的数据融入,以及新旧数据的融合,对数据层的融合为处理实例及关系的冲突,避免不必要的冗余;
12.s5、知识图谱补全:对步骤s1中构建的农业知识图谱初始数据库中的数据进行补全。
13.优选地,步骤s2中,所述任务发布函数,为用于实现对任务发布的智能合约,包括对任务的类型、专业领域、发布内容描述、任务的截止日期、任务分配信用要求、非对称加密的公钥、任务所需接包方数量、任务难度等级、任务奖励、任务分配模式进行信息建模;所述任务分配模式包含工人选择任务和任务选择工人两种模式;
14.所述任务分配函数,为用于实现众包任务分配的智能合约,包括对两种任务分配模式的实现,根据任务建模的分配模式信息实现任务分配;任务建模的分配模式包括工人选择任务模式和任务选择工人模式;工人选择任务模式:基于众包工人筛选出可选择的众包任务,工人自行选择感兴趣任务;任务选择工人模式:自动分配给符合任务要求的工人,采用的分配策略是基于用户空闲情况、用户信用评分、用户擅长领域相似度、众包质量评分、任务完成率指标建立分配模型,实现自动任务分配;
15.所述任务质量评估函数,为用于实现对众包任务答案质量评估的智能合约,包括任务答案整合策略,基于采取少数服从多数的设计思路,融入用户置信度作为权重系数,其置信度来源是基于众包工人信用评分归一化计算,最终得到众包任务可信任的答案。
16.优选的,步骤s2中,所述获取众包任务数据,具体步骤为:
17.s201、发布任务:众包发包人发布用于构建农业知识图谱的众包任务,并通过智能合约任务发布函数进行限制约束;
18.s202、接收任务:按照众包发包人对任务的分配模式设置,执行如下:工人选择任务模式下,众包工人通过任务列表主动选择感兴趣的任务;任务选择工人模式下,通过智能合约任务分配函数自动将任务分配给众包工人;
19.s203、任务实施:众包工人按照任务要求实施所接收的任务完成标注;
20.s204、聚合数据及上链:即质量评估聚合答案及数据上链,待众包任务标注的进度达到100%后,触发智能合约任务质量评估函数,得到众包任务可信任的答案数据,然后将实施过程及任务答案数据上传至区块链;
21.s205、任务评价:发包人可根据众包工人对任务参与实施过程是否存在恶意欺骗行为进行评价,待平台管理员审核通过后计入恶意参与次数。
22.优选的,步骤s3中,采用bert+bilstm+cnn+attention的模型对所述步骤s2得到的任务答案数据进行联合抽取,具体步骤为:
23.s301、将原始文本语句序列传入bert中,使用优化器adamw得到编码序列;
24.s302、进入self attention后,将获得的向量与先验特征进行拼接;
25.s303、将获得的拼接结果传入cnn和全连接层,指针与标注结构预测抽取出头实体的首、尾;
26.s304、训练采样随机获取已经标注的头实体,在预测环节遍历全部的头实体信息,将获取到的序列与bilstm相互拼接,得到头实体的编码向量;
27.s305、加上相对位置的位置嵌入,获得目标与序列等长的向量序列;
28.s306、再重复一轮self attention、cnn、全连接层,使之每一种属性都对应到一个半指针-半标注的预测出的尾实体的首、尾,最终输出所述原始文本语句包含的所有三元组。
29.优选的,所述构建方法还包括步骤s2

、建立众包工人信用评价体系:对步骤s2中参与的众包工人信用评估,结合众包工人参与的众包任务完成情况构建信用评价模型,然后基于模型对众包工人动态化信用评分。
30.优选的,所述众包补全根据步骤s1获得补全任务数据,将其补充到步骤s1构建的农业知识图谱初始数据库据库中;人工补全主要参与对象为本技术领域的专家或有权限的众包用户;自动补全实现小样本情景下的知识图谱补全任务embedding,采用链路预测模型(metar模型)根据步骤s1构建的农业知识图谱初始数据库的数据训练,预测出三元组不存在的实体、关系、属性,即给定头部实体h 及查询关系r,预测尾部实体t,表示为{(h,r,t)},从而获得完整三元组数据,并将三元组数据补充到步骤s1构建的农业知识图谱初始数据库。
31.优选的,步骤s2

中,从初始纬度、交易纬度、质量纬度、惩罚纬度四个方面构建所述信用评价模型,然后基于模型对众包工人动态化信用评分;其中,所述初始纬度是指注册众包工人的基本信息,包括用户实名认证情况、专业技能评级、文化程度;所述交易纬度是指众包工人完成任务总数量、单位时间完成数量、总接单完成率、单位时间接单完成率;所述质量纬度是指众包工人任务答案采纳率、单位时间答案采纳率、任务平均完成速度;惩罚纬度指惩罚次数、单位时间惩罚次数;所述动态化信用评分是指每次众包任务结束或用户参与众包任务提交完成会执行信用评价模型计算用户信用评分并更新到数据库。
32.优选的,所述众包工人动态化信用评分的方式为:义评价指标参数集合p={p1,p2,p3,

,pn},评价指标权重集合w={w
p1
,w
p2
,w
p3


, w
pn
},评价指标分数集合s={s
p1
,s
p2
,s
p3


,s
p4
},计算信用评分
33.优选的,所述步骤s2

还包括:依据得到的众包工人信用评分,设置不同奖励模式的奖励机制,具体包括:(1)图谱访问奖励:依据众包工人信用评分,针对达到系统设置信用评分要求的用户开放知识图谱的访问和下载权限;(2)管理权限奖励:对于众包工人完成任务数量和信用评分符合系统设置要求的,给予更高管理权限,可参与维护知识图谱数据库的纠错和补全;(3)荣誉榜单及证书奖励:设置平台优秀贡献榜单及贡献证书,依据工作量、用户信用等信息作为排序规则,在系统中以贡献总榜、月榜的形式动态展示贡献排名,同时长期对较大贡献者,颁发平台贡献证书。
34.本发明的第二方面提供了一种基于区块链的农业众包知识图谱的构建系统,包括:
35.用户管理模块,用于众包发包人和众包工人的注册、登录,用户基本信息管理,管理员用户对众包用户的管理;
36.任务管理模块,用于众包发包人管理众包任务,包括创建、编辑、发布、删除众包任
务,发布的众包任务信息查看、历史完成的众包任务查看;众包工人查看实时任务、参与众包任务以及查看历史已完成任务;
37.众包溯源模块,用于对农业知识图谱构建过程上链数据溯源,查看每个三元组的构建过程及参与的构建人员,查询构建过程中非法篡改记录数据以及能即时产生预警信息提醒管理员;
38.知识图谱补全纠错模块,用于对农业知识图谱的数据库众包补全、人工补全、自动补全、以及对图谱的错误实体和关系进行校正;
39.知识图谱展示模块:用于农业知识图谱的查询和数据下载,管理员用户和拥有可视化权限的众包用户可通过可视化的形式查看,以关系图形式展示农业知识图谱数据;
40.贡献展示模块,用于展示众包用户贡献的荣誉排行。
41.与现有技术相比,本发明具备如下有益效果:
42.本发明将众包和区块链的技术引入农业知识图谱的构建中,将知识图谱构建环节任务交给众包完成,将区块链技术引入众包知识图谱的构建流程中,提出融合区块链智能合约的众包农业知识图谱构建策略;通过将众包构建知识图谱的过程上链,实现了数据的不可篡改、可追溯、可信任;通过建立众包用户信用评价体系,对众包用户动态化信用评分,同时设立基于用户信用评分的奖励机制,有效提高了众包完成质量和专业领域人员长期参与积极性;针对众包的数据采用联合抽取方法和多种补全方法,提高了三元组的抽取效率和知识图谱的完整性,同时建立众包用户信用评价体系和奖励机制,提高了众包完成质量和专业领域人员长期参与积极性。本发明系统有效解决了农业知识图谱构建中数据泄露、可信度低、构建效率低、质量难评估等问题,构建了农业领域高质量的知识图谱。
附图说明
43.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
44.图1为本发明提供的一种基于区块链的农业众包知识图谱的构建方法的流程图;
45.图2为区块链智能合约的众包平台架构的示意图;
46.图3为众包数据获取的流程图;
47.图4为众包工人动态信用评价的示意图;
48.图5为联合抽取模型流程图;
49.图6为本发明提供的一种基于区块链的农业众包知识图谱的构建系统的架构图。
具体实施方式
50.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。
51.传统基于众包技术的系统是由一个中央集权机构来执行空间众包系统的所有过程,该系统容易出现单点失败、用户信息泄露等风险,而区块链技术可以解决这些问题。在设计众包问题给与众包分发者的权限过大,传统做法依赖于随机性,对于具有领域专业知
识的众包工人,关注度不够。利用区块链机制,可以规范其上传的内容和格式,而分配任务也由区块链完成实现,区块链机制可以收集准确的各类信息,从而更加有效地分配任务。
52.实施例1
53.参照图1,本发明实施例提供了一种基于区块链的农业众包知识图谱的构建方法,包括以下步骤:
54.s1、构建农业知识图谱初始数据库;
55.具体地,首先,获取农业知识图谱初始数据,包括已有的农业知识图谱、农业专家收集的图谱资源和农业领域专业机构公开数据资源,将三者组合形成基础农业数据三元组,并存储到图数据库,构建农业知识图谱初始数据库;
56.s2、融合区块链智能合约的众包平台架构,获取众包任务数据,并上传至区块链;
57.区块链智能合约的众包平台是基于fabric的区块链系统,能够实现全流程数据上链。该平台主要由系统客户端、fabric区块链、 django服务器、couchdb数据库和ipfs服务器等部分组成,如图2 所示,为区块链智能合约的众包平台架构的示意图。构建平台使用 b/s架构,前端开发使用vue框架,后端使用django完成开发。区块链通信通过fabric提供的相关接口实现,比如写入数据、查询数据等操作。另外,用户还可以通过web客户端的可视化页面与django 服务器、ipfs服务器进行交互,将数据存储在couchdb数据库和区块链相结合的机构中,很好地解决了条件查询等问题,提高系统性能,增加用户体验。
58.本发明采用智能合约技术在区块链上实现与部署众包工作流程,设计任务发布函数、任务分配函数以及任务质量评估函数,采取智能合约同时协约,获得众包任务可信任的答案,并将实施过程和众包任务可信任的答案作为众包任务数据上传至区块链。
59.这里将智能合约定义为分别从任务准备阶段、任务执行阶段以及任务答案整合阶段设计的智能合约函数的基本模型,具体包括:
60.任务发布函数:该函数实现对任务发布的智能合约,其所述的智能合约包括对任务的类型、专业领域、发布内容描述、任务的截止日期、任务分配信用要求、非对称加密的公钥、任务所需接包方数量(不能低于系统最低要求数量)、任务难度等级、任务奖励、任务分配模式进行信息建模,其所述任务分配模式包含工人选择任务和任务选择工人两种模式。
61.任务分配函数:该函数为用于实现众包任务分配的智能合约,包括对两种任务分配模式的实现,根据任务建模的分配模式信息实现任务分配;任务建模的分配模式包括工人选择任务模式和任务选择工人模式;工人选择任务模式:基于众包工人筛选出可选择的众包任务,工人自行选择感兴趣任务;任务选择工人模式:自动分配给符合任务要求的工人,采取的分配策略是基于用户空闲情况、用户信用评分、用户擅长领域相似度、众包质量评分、任务完成率指标建立分配模型,实现自动任务分配;
62.任务质量评估函数:该函数为用于实现对众包任务答案质量评估的智能合约,包括任务答案整合策略,基于采取少数服从多数的设计思路,融入用户置信度作为权重系数,其置信度来源是基于众包工人信用评分归一化计算,最终得到众包任务可信任的答案。
63.本发明中,上述区块链智能合约会约束众包任务的发布、众包任务提交过程、以及众包任务提交完成后答案整合,也就是说,区块链的智能合约是从任务准备阶段、任务执行阶段至任务答案整合阶段对众包整个执行过程的各个阶段进行限制。
64.具体地,参照图3,获取众包任务数据的步骤如下:
65.s201、发布任务:众包发包人发布用于构建农业知识图谱的众包任务,并通过智能合约任务发布函数进行限制约束;
66.s202、接收任务:按照众包发包人对任务的分配模式设置,执行如下:工人选择任务模式下,众包工人通过任务列表主动选择感兴趣的任务;任务选择工人模式下,通过智能合约任务分配函数自动将任务分配给众包工人;
67.s203、任务实施:众包工人按照任务要求实施所接收的任务完成标注;
68.s204、聚合数据及上链:即质量评估聚合答案及数据上链,待众包任务标注的进度达到100%后,触发智能合约任务质量评估函数,得到众包任务可信任的答案数据,然后将实施过程及任务答案数据作为众包任务数据上传至区块链;
69.s205、任务评价:发包人可根据众包工人对任务参与实施过程是否存在恶意欺骗行为进行评价,待平台管理员审核通过后计入恶意参与次数。
70.s2

、建立众包工人信用评价体系;
71.本发明中的建立众包工人信用评价体系是对步骤s2参与用户 (即众包工人)信用评估,结合众包工人参与的众包任务完成质量情况、完成任务数量、擅长知识类型等构建信用评价模型,对众包工人动态化信用评分;
72.参照图4,本发明从初始纬度、交易纬度、质量纬度、惩罚纬度四个方面建立信用评价模型,针对众包工人进行动态化信用评分。其中,初始纬度是指注册众包工人的基本信息,包括用户实名认证情况、专业技能评级、文化程度;交易纬度是指众包工人完成任务总数量、单位时间完成数量、总接单完成率、单位时间接单完成率;质量纬度是指众包工人任务答案采纳率、单位时间答案采纳率、任务平均完成速度;惩罚纬度指惩罚次数、单位时间惩罚次数;动态化信用评分是指每次众包任务结束或用户参与众包任务提交完成会执行信用评价模型计算用户信用评分并更新到数据库。
73.动态化计算众包工人信用评分方式如下:义评价指标参数集合 p={p1,p2,p3,

,pn},评价指标权重集合w={w
p1
,w
p2
,w
p3


,w
pn
},评价指标分数集合s={s
p1
,s
p2
,s
p3


,s
p4
},计算信用评分
74.由于农业众包知识图谱的构建不是一蹴而就的,需要长期具有不同的知识储备的用户参与构建,鉴于此,本发明从用户出发,引入了奖励机制,基于众包工人信用评分设置了不同奖励模式的奖励机制,以激励长期具有不同的知识储备的用户参与构建。具体包括:(1) 图谱访问奖励:依据众包工人信用评分,针对达到系统设置信用评分要求(信用评分超过0.6,且参与众包任务大于六十次)的用户,开放知识图谱的访问和下载权限;(2)管理权限奖励:对于众包工人完成任务数量和信用评分符合系统设置要求(完成任务数量和工作质量评分最高的前十)的用户,通过fabric机制和系统设置,给予更高的管理权限,可参与维护知识图谱数据库的纠错和补全,以促使用户进一步提高自身众包水平,完善知识图谱的构建;(3)荣誉榜单及证书奖励:对于每一个参与众包的构建者,通过依托区块链机制,设置平台优秀贡献榜单及贡献证书,依据工作量、用户信用、完成任务的优劣等信息作为排序规则,在知识图谱中以贡献总榜、月榜的形式动态展示贡献排名,同时长期对较大贡献者,颁发平台贡献证书。
75.s3、获取三元组数据;
76.具体地,本发明采用bert+bilstm+cnn+attention的模型(已通过训练)通过对步骤s2得到的任务答案数据进行命名实体识别、以及对属性关系的联合抽取来获取三元组数据,然后存储到步骤s1构建的农业知识图谱初始数据库中,参照图5,具体步骤包括:
77.s301、将的原始文本语句序列(通过众包获得的文本内容)传入 bert中,使用优化器adamw得到编码序列;
78.s302、进入self attention后,将获得的向量与先验特征进行拼接;
79.s303、将获得的拼接结果传入cnn和全连接层,指针与标注结构预测抽取出头实体的首、尾;
80.s304、训练采样随机获取已经标注的头实体,在预测环节遍历全部的头实体信息,将获取到的序列与bilstm相互拼接,得到头实体的编码向量;
81.s305、加上相对位置的位置嵌入,获得目标与序列等长的向量序列;
82.s306、再重复一轮self attention、cnn、全连接层,使之每一种属性都对应到一个半指针-半标注的预测出的尾实体的首、尾,最终输出所述原始文本语句包含的所有三元组。
83.s4、知识融合;
84.本发明中的知识融合指在将步骤s3获得的三元组数据合并到步骤s1构建的农业知识图谱初始数据库中,同时分别对模式层和数据层进行融合:对模式层的融合为处理新得到的数据融入,以及新旧数据的融合;对数据层的融合为处理实例及关系的冲突,避免不必要的冗余。
85.s5、知识图谱补全;
86.本发明中的知识图谱补全指对步骤s1中构建的农业知识图谱初始数据库中的数据进行补全,具体采用众包补全、人工补全和自动补全三种方式,其中,众包补全根据步骤s1获得补全任务数据,将其补充到步骤s1构建的农业知识图谱初始数据库中;人工补全主要参与对象为本技术领域的专家或有权限的众包用户;自动补全可实现小样本情景下的知识图谱补全任务embedding,采用链路预测模型 (metar模型)根据步骤s1构建的农业知识图谱初始数据库的数据训练,预测出三元组不存在的实体、关系、属性,即给定头部实体h 及查询关系r,预测尾部实体t,表示为{(h,r,t)},从而获得完整三元组数据,并将三元组数据补充到步骤s1构建的农业知识图谱初始数据库中。
87.本发明中,众包在构建农业知识图谱中的应用体现在进行联合抽取的前后,将涉及的数据交付给众包。区块链技术与众包知识图谱的构建相结合,具体体现在以下三个方面:(1)将众包参与构建的知识抽取、实体对齐、质量评估信息全部上传至区块链;(2)对上传信息的内容,通过区块链的智能合约作为监督,去除不符合规则的数据;(3)智能合约同时协约,使原先的评估总结不再由本地进行计算,而是由区块链达成共识、聚合答案。
88.实施例2
89.参照图6,本发明实施例提供了一种基于区块链的农业众包知识图谱构建系统,包括:
90.用户管理模块,用于众包发包人和众包工人的注册、登录,用户基本信息管理,管理员用户对众包用户的管理;
91.任务管理模块,用于众包发包人管理众包任务,包括创建、编辑、发布、删除众包任
务,发布的众包任务信息查看、历史完成的众包任务查看;众包工人查看实时任务、参与众包任务以及查看历史已完成任务;
92.众包溯源模块,用于对农业知识图谱构建过程上链数据溯源,查看每个三元组的构建过程及参与的构建人员,查询构建过程中非法篡改记录数据以及能即时产生预警信息提醒管理员;
93.知识图谱补全纠错模块,用于对农业知识图谱的数据库众包补全、人工补全、自动补全、以及对图谱的错误实体和关系进行校正;
94.知识图谱展示模块:用于农业知识图谱的查询和数据下载,管理员用户和拥有可视化权限的众包用户可通过可视化的形式查看,以关系图形式展示农业知识图谱数据;
95.贡献展示模块,用于展示众包用户贡献的荣誉排行。
96.本发明不局限于上述具体的实施方式,领域的普通技术人员从上述构思出发,不经过创造性的劳动,所做出的种种变换,均落在本发明的保护范围之内。

技术特征:
1.一种基于区块链的农业众包知识图谱的构建方法,其特征在于,包括以下步骤:s1、构建农业知识图谱初始数据库:获取农业知识图谱初始数据,包括已有的农业知识图谱、农业专家收集的图谱资源和农业领域专业机构公开数据资源,将三者组合形成基础农业数据三元组,并存储到图数据库,构建农业知识图谱初始数据库;s2、融合区块链智能合约的众包平台架构,获取众包任务数据,并上传至区块链:采用智能合约技术在区块链上实现与部署众包工作流程,设计任务发布函数、任务分配函数以及任务质量评估函数,采取智能合约同时协约,获得众包任务可信任的答案,并将实施过程和众包任务可信任的答案作为众包任务数据上传至区块链;s3、获取三元组数据:对步骤s2得到的任务答案数据进行命名实体识别、以及对属性关系的联合抽取,获取三元组数据,然后存储到步骤s1构建的农业知识图谱初始数据库中;s4、知识融合:将步骤s3获得的三元组数据合并到步骤s1构建的图数据库,同时分别对模式层和数据层进行融合;对模式层的融合为处理新得到的数据融入,以及新旧数据的融合,对数据层的融合为处理实例及关系的冲突,避免不必要的冗余;s5、知识图谱补全:对步骤s1中构建的农业知识图谱初始数据库中的数据进行补全。2.根据权利要求1所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,步骤s2中,所述任务发布函数,为用于实现对任务发布的智能合约,包括对任务的类型、专业领域、发布内容描述、任务的截止日期、任务分配信用要求、非对称加密的公钥、任务所需接包方数量、任务难度等级、任务奖励、任务分配模式进行信息建模;所述任务分配模式包含工人选择任务和任务选择工人两种模式;所述任务分配函数,为用于实现众包任务分配的智能合约,包括对两种任务分配模式的实现,根据任务建模的分配模式信息实现任务分配;任务建模的分配模式包括工人选择任务模式和任务选择工人模式;工人选择任务模式:基于众包工人筛选出可选择的众包任务,工人自行选择感兴趣任务;任务选择工人模式:自动分配给符合任务要求的工人,采用的分配策略是基于用户空闲情况、用户信用评分、用户擅长领域相似度、众包质量评分、任务完成率指标建立分配模型,实现自动任务分配;所述任务质量评估函数,为用于实现对众包任务答案质量评估的智能合约,包括任务答案整合策略,基于采取少数服从多数的设计思路,融入用户置信度作为权重系数,其置信度来源是基于众包工人信用评分归一化计算,最终得到众包任务可信任的答案。3.根据权利要求1所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,步骤s2中,所述获取众包任务数据,具体步骤为:s201、发布任务:众包发包人发布用于构建农业知识图谱的众包任务,并通过智能合约任务发布函数进行限制约束;s202、接收任务:按照众包发包人对任务的分配模式设置,执行如下:工人选择任务模式下,众包工人通过任务列表主动选择感兴趣的任务;任务选择工人模式下,通过智能合约任务分配函数自动将任务分配给众包工人;s203、任务实施:众包工人按照任务要求实施所接收的任务完成标注;s204、聚合数据及上链:即质量评估聚合答案及数据上链,待众包任务标注的进度达到100%后,触发智能合约任务质量评估函数,得到众包任务可信任的答案数据,然后将实施过程及任务答案数据上传至区块链;
s205、任务评价:发包人可根据众包工人对任务参与实施过程是否存在恶意欺骗行为进行评价,待平台管理员审核通过后计入恶意参与次数。4.根据权利要求1所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,步骤s3中,采用bert+bilstm+cnn+attention的模型对所述步骤s2得到的任务答案数据进行联合抽取,具体步骤为:s301、将原始文本语句序列传入bert中,使用优化器adamw得到编码序列;s302、进入self attention后,将获得的向量与先验特征进行拼接;s303、将获得的拼接结果传入cnn和全连接层,指针与标注结构预测抽取出头实体的首、尾;s304、训练采样随机获取已经标注的头实体,在预测环节遍历全部的头实体信息,将获取到的序列与bilstm相互拼接,得到头实体的编码向量;s305、加上相对位置的位置嵌入,获得目标与序列等长的向量序列;s306、再重复一轮self attention、cnn、全连接层,使之每一种属性都对应到一个半指针-半标注的预测出的尾实体的首、尾,最终输出所述原始文本语句包含的所有三元组。5.根据权利要求1所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,步骤s5中,所述补全采用众包补全、人工补全和自动补全三种方式;其中,所述众包补全是根据步骤s1获得补全任务数据,将其补充到步骤s1构建的农业知识图谱初始数据库中;所述人工补全的参与对象为本技术领域的专家或有权限的众包用户;所述自动补全实现小样本情景下的知识图谱补全任务embedding,通过采用metar模型根据步骤s1构建的农业知识图谱初始数据库中的数据训练,预测出三元组不存在的实体、关系、属性,即给定头部实体h及查询关系r,预测尾部实体t,表示为{(h,r,t)},从而获得完整三元组数据,并将三元组数据补充到步骤s1构建的农业知识图谱初始数据库中。6.根据权利要求1所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,所述构建方法还包括步骤s2

、建立众包工人信用评价体系:对步骤s2中参与的众包工人信用评估,结合众包工人参与的众包任务完成情况构建信用评价模型,然后基于模型对众包工人动态化信用评分。7.根据权利要求6所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,步骤s2

中,从初始纬度、交易纬度、质量纬度、惩罚纬度四个方面构建所述信用评价模型,然后基于模型对众包工人动态化信用评分;其中,所述初始纬度是指注册众包工人的基本信息,包括用户实名认证情况、专业技能评级、文化程度;所述交易纬度是指众包工人完成任务总数量、单位时间完成数量、总接单完成率、单位时间接单完成率;所述质量纬度是指众包工人任务答案采纳率、单位时间答案采纳率、任务平均完成速度;惩罚纬度指惩罚次数、单位时间惩罚次数;所述动态化信用评分是指每次众包任务结束或用户参与众包任务提交完成会执行信用评价模型计算用户信用评分并更新到数据库。8.根据权利要求7所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,所述众包工人动态化信用评分的方式为:义评价指标参数集合p={p1,p2,p3,

,p
n
},评价指标权重集合w={w
p1
,w
p2
,w
p3


,w
pn
},评价指标分数集合s={s
p1
,s
p2
,s
p3


,s
p4
},计算信用评分
9.根据权利要求8所述的基于区块链的农业众包知识图谱的构建方法,其特征在于,所述步骤s2

还包括:依据得到的众包工人信用评分,设置不同奖励模式的奖励机制,具体包括:(1)图谱访问奖励:依据众包工人信用评分,针对达到系统设置信用评分要求的用户开放知识图谱的访问和下载权限;(2)管理权限奖励:对于众包工人完成任务数量和信用评分符合系统设置要求的,给予更高管理权限,可参与维护知识图谱数据库的纠错和补全;(3)荣誉榜单及证书奖励:设置平台优秀贡献榜单及贡献证书,依据工作量、用户信用作为排序规则,在知识图谱中以贡献总榜、月榜的形式动态展示贡献排名,同时长期对较大贡献者,颁发平台贡献证书。10.一种基于区块链的农业众包知识图谱的构建系统,其特征在于,包括:用户管理模块,用于众包发包人和众包工人的注册、登录,用户基本信息管理,管理员用户对众包用户的管理;任务管理模块,用于众包发包人管理众包任务,包括创建、编辑、发布、删除众包任务,发布的众包任务信息查看、历史完成的众包任务查看;众包工人查看实时任务、参与众包任务以及查看历史已完成任务;众包溯源模块,用于对农业知识图谱构建过程上链数据溯源,查看每个三元组的构建过程及参与的构建人员,查询构建过程中非法篡改记录数据以及能即时产生预警信息提醒管理员;知识图谱补全纠错模块,用于对农业知识图谱的数据库众包补全、人工补全、自动补全、以及对图谱的错误实体和关系进行校正;知识图谱展示模块:用于农业知识图谱的查询和数据下载,管理员用户和拥有可视化权限的众包用户可通过可视化的形式查看,以关系图形式展示农业知识图谱数据;贡献展示模块,用于展示众包用户贡献的荣誉排行。

技术总结
本发明公开了一种基于区块链的农业众包知识图谱的构建方法及系统,本发明在农业知识图谱的构建中引入了众包和区块链技术,将农业知识图谱构建环节任务交给众包完成,将区块链技术引入众包农业知识图谱的构建流程中,提出融合区块链智能合约的众包农业知识图谱构建策略,并将众包构建知识图谱的过程上链,实现数据的不可篡改、可追溯、可信任;基于众包构建的农业知识图谱数据,采取联合抽取法和多种补全方式,提高了对众包数据三元组信息的抽取效率和知识图谱完整性;建立众包工人信用评价体系,有效提高了众包完成质量和专业领域人员长期参与积极性;本发明有效解决了农业知识图谱构建中数据易泄露、可信度低、构建效率低、质量难评估等问题。难评估等问题。难评估等问题。


技术研发人员:王超 谷刘涛 饶海笛 杨天罡 何进 夏迎春 辜丽川 焦俊 邹能锋
受保护的技术使用者:安徽农业大学
技术研发日:2022.06.28
技术公布日:2022/11/1
转载请注明原文地址: https://tieba.8miu.com/read-11306.html

最新回复(0)