1.本发明属于智能监测技术领域,具体涉及一种呼吸道传染病的监测预警系统及方法。
背景技术:2.知识图谱最先在2012年由google提出,用以描述其搜索引擎从不同来源获得的信息结果。这些信息的结果本质是一个多关系图(multi-relationalgraph),由不同的信息(节点)+关系(边)构成。
3.知识图谱在逻辑上分为数据层和模式层,数据层用来存储真实的数据。模式层在数据层之上,是知识图谱的核心,存储经过提炼的知识。构建知识图谱是一个迭代更新的过程,根据知识获取的逻辑,每一轮迭代包含三个阶段:信息抽取,从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;知识融合,在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;知识加工,对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量。
4.现有技术中的一种新冠肺炎多点触发监测预警响应系统,是通过移动 app实现对学校、托幼机构、交通站场、养老机构、商场超市、餐馆、社区 (村)等有发热等早期症状者的基本信息的自行填报,包括人员的基础信息、症状等信息。在县区、市、省疾病预防控制中心建立预警管理员,对上报信息及时进行分析、处置。但是其无法解决对于社区需重点监测人群的信息填报内容不全面,工作成本高、效率低,未能提高社区早期监测预警能力的问题
5.鉴于此,目前亟待提出一种呼吸道传染病的监测预警系统及方法。
技术实现要素:6.为此,本发明所要解决的技术问题是提供一种呼吸道传染病的监测预警系统及方法,实现信息来源多渠道、监测预警智慧化、多点触发的目标,以提高应对突发公共卫生事件的应急处置能力。
7.本发明的一种呼吸道传染病的监测预警系统,包括:
8.包括社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统;
9.所述社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统均包括如下层架构:
10.源数据层,获取源数据;
11.基础资源层,用于提供数据加密服务,根据数据加密需求调用mysql、 docker和hyperledgerfabric;
12.数据服务层,用于提供查询服务和告警服务,通过知识图谱和规则引擎对源数据进行统计分析;所述数据服务层内存储规则库;
13.数据可视化层,用于可视化数据,调用告警规则根据可视化数据进行告警,同时根据需求对告警规则进行管理。
14.进一步的,所述社区监测端子系统实现对社区居民、社区健康监测人群和重点监测行业工作人员基本信息的自行填报,包括人员的基础信息、基础疾病、流行病学史、症状等信息;
15.信息填报完成提交后,系统依据知识图谱及规则引擎诊断,自动反馈诊疗建议及防护建议;
16.数据脱敏后加密发送至群体监测预警子系统。
17.进一步的,医院端个体监测系统与院内his系统、pacs系统集成,采集患者诊疗信息,根据知识图谱及规则引擎反馈患者可能患有哪类疾病并给出就诊及防护建议,系统采用多模态模型,向医生提供多阶段预测预警信息,实现早期分诊及早期防护的目标;
18.系统将患者相关信息脱敏后通过加密方式反馈至群体监测预警子系统。
19.进一步的,群体监测预警子系统包含可视化、统计分析、告警管理等功能;
20.数据来源于个体监测预警子系统和医院端个体监测系统,基于时空分析技术,从群体角度监测具有特定症候群特征人群的时空聚集性,对疾病的潜在传播实现早期预警,并实现重点数据展示、多维度数据趋势分析、多级别告警管理。
21.进一步的,所述知识图谱知识表示学习的代表模型包括距离模型、单层神经网络模型、双线性模型、神经张量模型、矩阵分解模型和翻译模型;
22.其中,距离模型,首先将实体用向量进行表示,然后通过关系矩阵将实体投影到与实体关系对的向量空间中,最后通过计算投影向量之间的距离来判断实体间已存在的关系的置信度;
23.双线性模型是通过基于实体间关系的双线性变换来刻画实体在关系下的语义相关性;
24.神经张量模型是在不同的维度下,将实体联系起来,表示实体间复杂的语义联系;
25.transe模型是将知识库中实体之间的关系看成是从实体间的某种平移,并用向量表示。
26.进一步的,所述知识图谱进行知识融合时包括
27.初步筛选,用于初步筛选融合标识符相同的实体数据;
28.判断属性相似度,用于配置相似属性和相似度函数,并判断数据之间的属性相似度;
29.融合知识:对属性相似度均达到阈值条件的数据进行融合;
30.判断实体相似度,根据属性相似度向量得到实体的相似度。
31.进一步的,所述知识图谱的存储包括基于表结构的存储和基于图结构的存储;
32.其中,基于表结构的存储,利用二维的数据表对知识图谱中的数据进行存储,包括三元组表、类型表、关系数据库;
33.基于图结构的存储,利用图的方式对知识图谱中的数据进行存储,包括图数据库。
34.进一步的,所述数据服务层设有规则引擎,所述规则引擎包括
35.正向链接,基于插入的fact对象和fact对象的更新,利用可用的fact 推理规则来提取出更多的fact对象,直到计算出最终目标,最终会有一个或多个规则被匹配,并计划执
行;
36.反向链接,从规则引擎假设的结论开始,如果不能够直接满足这些假设,则搜索可满足假设的子目标。
37.本发明还提供一种呼吸道传染病的监控预警方法,包括如下步骤:
38.步骤1、社区端采集社区居民、社区健康监测人群和重点监测行业工作人员的基本信息;医疗端个体监测子系统采集患者诊疗信息;
39.步骤2、根据知识图谱和规则引擎对基本信息和诊疗信息进行诊断,得到基本信息和诊疗信息各自对应的诊疗建议及防护建议;
40.步骤3、对基本信息和诊疗信息进行脱敏和加密处理后上传至群体监测子系统;
41.步骤4、群体监测子系统集中展示经处理后的基本信息和诊疗信息。
42.进一步的,步骤4中,展示过程具体为
43.以时间维度、折线图堆叠和柱状图、堆叠区域图进行趋势分析和展示趋势分析、展现。
44.进一步的,步骤2中,进行诊断具体包括如下步骤:
45.将基本信息和诊疗信息抽象为症状描述文本,同时和血液检查的数据字段输入至决策树算法内;
46.将症状描述文本进行特征提取后生成对应的512维特征向量;
47.将血液检查的数据字段进行数据归一化处理为血液特征向量;
48.决策树以所述512维特征向量和所述血液特征向量为训练数据进行迭代训练;
49.诊断出对应的疾病分类概率。
50.本发明的上述技术方案,相比现有技术具有以下优点:
51.本发明通过综合采用大数据、人工智能、隐私数据保护等技术,构建多维度、多领域的综合、联动、协作的监测预警平台,建立传染病监测前哨,在法定传染病监测的基础上,增加症候群症状和不明原因传染病的智能监测预警,实现信息来源多渠道、监测预警智慧化、多点触发的目标,以提高应对突发公共卫生事件的应急处置能力。
52.本发明解决了对于社区需重点监测人群的信息填报内容不全面,工作成本高、效率低,未能提高社区早期监测预警能力的问题。同时解决了对社区已知和未知发热伴呼吸道传染病的监测预警问题。
53.本发明通过移动端实现对社区相关人员、社区健康监测人群和重点监测行业工作人员基本信息的自行填报,包括人员的基础信息、基础疾病、流行病学史、症状等信息。信息填报完成提交后,系统依据知识图谱及规则引擎诊断,自动反馈诊疗建议及防护建议。
附图说明
54.图1是本发明实施例提供的系统的结构原理示意图。
具体实施方式
55.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例,都属于本发明保护的范围。
56.实施例一
57.本实施例的呼吸道传染病的监测预警系统,如图1所示,包括:
58.包括社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统;
59.所述社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统均包括如下层架构:
60.源数据层,获取源数据;
61.基础资源层,用于提供数据加密服务,根据数据加密需求调用mysql、 docker和hyperledgerfabric;
62.数据服务层,用于提供查询服务和告警服务,通过知识图谱和规则引擎对源数据进行统计分析;所述数据服务层内存储规则库;
63.数据可视化层,用于可视化数据,调用告警规则根据可视化数据进行告警,同时根据需求对告警规则进行管理。
64.进一步的,所述社区监测端子系统实现对社区居民、社区健康监测人群和重点监测行业工作人员基本信息的自行填报,包括人员的基础信息、基础疾病、流行病学史、症状等信息;
65.信息填报完成提交后,系统依据知识图谱及规则引擎诊断,自动反馈诊疗建议及防护建议;
66.数据脱敏后加密发送至群体监测预警子系统。
67.进一步的,医院端个体监测系统与院内his系统、pacs系统集成,采集患者诊疗信息,根据知识图谱及规则引擎反馈患者可能患有哪类疾病并给出就诊及防护建议,系统采用多模态模型,向医生提供多阶段预测预警信息,实现早期分诊及早期防护的目标;
68.系统将患者相关信息脱敏后通过加密方式反馈至群体监测预警子系统。
69.进一步的,群体监测预警子系统包含可视化、统计分析、告警管理等功能;
70.数据来源于个体监测预警子系统和医院端个体监测系统,基于时空分析技术,从群体角度监测具有特定症候群特征人群的时空聚集性,对疾病的潜在传播实现早期预警,并实现重点数据展示、多维度数据趋势分析、多级别告警管理。
71.本实施例中,由于需要在各医院、社区和哨点之间进行信息加密,出于保护用户隐私和数据安全的特点,本实施例中的加密采用端对端的加密方法,端到端加密允许数据在从源点到终点的传输过程中始终以密文形式存在。采用端到端加密(又称脱线加密或包加密),消息在被传输时到达终点之前不进行解密,因为消息在整个传输过程中均受到保护,所以即使有节点被损坏也不会使消息泄露。
72.端到端加密系统与链路加密和节点加密相比更可靠,更容易设计、实现和维护。端到端加密还避免了其它加密系统所固有的同步问题,因为每个报文包均是独立被加密的,所以一个报文包所发生的传输错误不会影响后续的报文包。此外,从用户对安全需求的直觉上讲,端到端加密更自然些。单个用户可能会选用这种加密方法,以便不影响网络上的其他用户,此方法只需要源和目的节点是保密的即可。
73.端到端加密系统通常不允许对消息的目的地址进行加密,这是因为每一个消息所经过的节点都要用此地址来确定如何传输消息。由于这种加密方法不能掩盖被传输消息的
源点与终点,因此它对于防止攻击者分析通信业务是脆弱的。
74.本实施例中的统计分析法指指用有效的(适当的)统计分析方法对所收集的数据进行分析,将它们进行汇总和理解并消化,从而提取有用的信息并形成结论,从而为决策提供依据或建议。
75.统计分析的目的:把隐藏在一大批看似杂乱无章的的数据背后的信息进行集中和提炼,总结出所研究对象的内在规律。
76.统计分析的三个步骤:
77.收集数据是进行统计分析的前提和基础。收集数据的途径众多,可通过实验、观察、测量、调查等获得直接资料,也可通过文献检索、阅读等来获得间接资料。收集数据的过程中除了要注意资料的真实性和可靠性外,还要特别注意区分两类不同性质的资料:一是连续数据,也叫计量资料,指通过实际测量得到的数据;二是间断数据,也叫计数资料,指通过对事物类别、等级等属性点计所得的数据。
78.整理数据就是按一定的标准对收集到的数据进行归类汇总的过程。由于收集到的数据大多是无序的、零散的、不系统的,在进入统计运算之前,需要按照研究的目的和要求对数据进行核实,剔除其中不真实的部分,再分组汇总或列表,从而使原始资料简单化、形象化、系统化,并能初步反映数据的分布特征。
79.分析数据指在整理数据的基础上,通过统计运算,得出结论的过程,它是统计分析的核心和关键。数据分析通常可分为两个层次:第一个层次是用描述统计的方法计算出反映数据集中趋势、离散程度和相关强度的具有外在代表性的指标;第二个层次是在描述统计基础上,用推断统计的方法对数据进行处理,以样本信息推断总体情况,并分析和推测总体的特征和规律
80.统计分析方法:
81.从统计理论上看,我们所见到的统计学著作,除了统计设计、统计调查、统计整理等理论和方法外,其他大部分内容都是统计分析方法,这些统计分析方法有一个共同点,它们都是定量分析方法。
82.统计实践上看,统计分析所起的作用,是通过定量分析实现的。统计分析在人们的认识过程中有三个作用:第一,对客观事物量化,包括反映客观事物规律的数量表现;第二,根据量变程度确认事物的质,即确定区别事物质量的数量界限;第三,揭示新的规律,即通过分析数量关系,发现尚未被认识的事物的规律。以上作用没有一个不通过定量分析。
83.从统计的特点上看,统计是认识社会的有力武器之一,但不是唯一的武器,各门科学都是对客观规律的认识,统计学区别于其他学科的显著特点之一,就是统计的数量性。正因为如此,各门实质性科学都离不开统计,实质性科学通过统计定量分析,才能达到精密化。
84.时空分析
85.时空数据挖掘在许多领域得到应用,如疾病监控、环境监测、公共卫生与医疗健康等。时空数据挖掘作为一个新兴的研究领域,正致力于开发和应用新兴的计算技术来分析海量、高维的时空数据,发掘时空数据中有价值的信息。
86.数据都有两个基本的固有属性:空间和时间属性。其中,空间属性可以指绝对的位置属性,也可以指相对的空间关系,一般来说,空间关系又可以按照如下两种方式进行划
分:
87.局部或全局。局部的:同一节点(或对象)内部,各属性维度之间的关系;全局的:不同节点(或对象)之间的关系。
88.隐式或显式。隐式的:维度或节点之间的关系可以作为特征维度来考量,不以关系图结构的形式呈现;显式的:节点(或对象)之间可以构建明显的关系图结构。
89.对于时间关系,一般都是以序列的形式呈现。因此把时空序列作为一种统一的、基本的数据结构来进行分析,可以分为如下四种基本数据结构:
90.单节点、单维度序列;单节点、多维度序列;多节点、单维度序列;多节点、多维度序列。
91.时空数据分析的七类主要方法,包括:时空数据可视化,目的是通过视觉启发假设和选择分析模型;空间统计指标的时序分析,反映空间格局随时间变化;时空变化指标,体现时空变化的综合统计量;时空格局和异常探测,揭示时空过程的不变和变化部分;时空插值,以获得未抽样点的数值;时空回归,建立因变量和解释变量之间的统计关系;时空过程建模,建立时空过程的机理数学模型;时空演化树,利用空间数据重建时空演化路径。
92.本实施例中的隐私数据的加密传输
93.数字经济时代,数据已成为重要的生产要素,收集、使用和分析数据的规模和速度正在迅速增加。然而,出于数据安全和个人信息保护方面的考虑,数据共享的落地仍进展缓慢。因此,为打破“数据孤岛”,充分释放数据的价值, 隐私计算技术应运而生。
94.根据联合国大数据全球工作组的定义,隐私计算(privacy-preservingcomputation)是指可在保证原始数据加密或者不可见的状态下、对数据进行计算和分析的一系列技术,包括安全多方计算、同态加密、可信执行环境、差分隐私、联邦学习等。在隐私计算中,原始数据不会离开“所有者”,各参与方只分享最终的计算结果,实现了数据“所有权”与使用权的分离,从而可以最大限度挖掘数据要素的价值,为数据融合需求与隐私保护要求提供了解决方案。
95.隐私计算技术的核心思想是通过代码加密、算法等方法,构建数据共享的信任基础。当前,行业技术主要可以分为三类:
96.密码学技术:以安全多方计算、同态加密为代表,通过算法对原始数据进行加密或分割,保证数据接收方无法识别。
97.可信执行环境:基于硬件的防护能力构建一个安全区域,将需要保护的数据汇聚到该区域后进行计算。
98.联邦学习:隐私计算在人工智能领域的最新应用,多个参与方之间无需共享训练数据,只传输模型参数,从而实现在原始数据不离开企业私有域的前提下,进行联合建模。
99.(一)安全多方计算
100.安全多方计算主要研究“在无可信第三方的情况下,如何安全地计算一个约定函数”的问题。《多方安全计算金融应用技术规范》将其定义为“一种基于多方数据协同完成计算目标,实现除计算结果及其可推导出的信息之外不泄漏各方隐私数据的密码技术。”101.安全多方计算常用的密码技术有混淆电路、不经意传输、秘密共享、同态加密等。通过运行安全多方计算协议,多个参与方可以在不暴露数据明文的情况下进行协作,共同对数据执行计算,当协议完成时,各参与方只知道自己的输入和计算结果,而无法获知其他
learning,dl),特别是深度卷积神经网络(convolutionalneural networks,cnns)已经迅速发展成为医学图像分析的研究热点,它能够从医学图像大数据中自动特区隐含的疾病诊断特征。
117.主要的医学图像分析任务:
118.医学图像分类与识别
119.临床医生需要借助医学图像来辅助诊断人体是否有病灶,并对病灶的轻重程度进行量化分级,因此自动识别图像中的病灶区域和正常组织器官是医学图像分析的基本任务。
120.医学图像定位与检测
121.人体组织器官解剖结构和病灶区域的定位是临床治疗计划和干预流程中非常重要的预处理步骤,定位的精度直接影响治疗的效果。图像目标定位任务不仅需要识别图像中的特定目标,而且需要确定其具体的物理位置。图像目标检测任务则需要把图像中所有目标识别出来,且确定它们的物理位置和类别。
122.医学图像分割任务
123.图像分割是识别图像中感兴趣的目标区域内部体素以及外部轮廓,它是临床手术图像导航和图像引导肿瘤放疗的关键任务。
124.常用模型有vgg网络、resnet网络、efficientnet网络。
125.在本实施例中,知识图谱在逻辑上分为数据层和模式层,数据层用来存储真实的数据。模式层在数据层之上,是知识图谱的核心,存储经过提炼的知识。构建知识图谱是一个迭代更新的过程,根据知识获取的逻辑,每一轮迭代包含三个阶段:信息抽取,从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;知识融合,在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;知识加工,对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量。
126.大规模知识库的构建与应用需要多种技术的支持。通过知识提取技术,可以从一些公开的半结构化、非结构化和第三方结构化数据库的数据中提取出实体、关系、属性等知识要素。知识表示则通过一定有效手段对知识要素表示,便于进一步处理使用。然后通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。
127.本实施例中,规则引擎由推理引擎发展而来,是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入,解释业务规则,并根据业务规则做出业务决策。规则引擎整合了传入系统的fact集合和规则集合,从而去触发一个或多个业务操作。规则通常以声明式的方式在业务代码中实现,我们可能以为它很少会被改变。但事实上,这些业务逻辑的判断条件经常会被改变。在本篇文章中的业务逻辑或规则,通常是可以表示为“在某写条件下,执行某些任务”。在拥有大量规则和fact对象的业务系统中,可能会出现多个fact 输入都会导致同样的输出,这种情况我们通常称作规则冲突。规则引擎可以采用不同的冲突解决方案来确定
冲突规则的执行顺序。
128.在本实施例中的规则引擎,有两种执行方式:
129.正向链接:这是一种基于“数据驱动”的形式,基于插入的fact对象和 fact对象的更新,规则引擎利用可用的fact推理规则来提取出更多的fact 对象,直到计算出最终目标,最终会有一个或多个规则被匹配,并计划执行。因此,规则引擎始于事实,始于结论。
130.反向链接:这是一种基于“目标驱动”或推理形式,与正向链接相反。反向链条从规则引擎假设的结论开始,如果不能够直接满足这些假设,则搜索可满足假设的子目标。规则引擎会循环执行这一过程,直到证明结论或没有更多可证明的子目标为止。
131.实施例二
132.本实施例提供一种呼吸道传染病的监测预警方法,包括如下步骤:
133.步骤1、社区端采集社区居民、社区健康监测人群和重点监测行业工作人员的基本信息;医疗端个体监测子系统采集患者诊疗信息;
134.步骤2、根据知识图谱和规则引擎对基本信息和诊疗信息进行诊断,得到基本信息和诊疗信息各自对应的诊疗建议及防护建议;
135.步骤3、对基本信息和诊疗信息进行脱敏和加密处理后上传至群体监测子系统;
136.步骤4、群体监测子系统集中展示经处理后的基本信息和诊疗信息,以时间维度、折线图堆叠和柱状图、堆叠区域图进行趋势分析和展示趋势分析、展现。
137.在本实施例中,进行诊断时,将基本信息和诊疗信息抽象为症状描述文本,同时和血液检查的数据字段输入至决策树算法内;所述血液检查的数据字段包括:“红细胞计数”,“淋巴细胞计数”,“c-反应蛋白”,“血红蛋白”,
ꢀ“
白细胞”等。
138.使用基于病人的症状描述文本用bert预训练模型先做一次预训练,利用bert预训练模型抽取文本特征向量后生成对应的512维特征向量。
139.将血液检查的数据字段进行数据归一化处理为血液特征向量。
140.决策树以所述512维特征向量和所述血液特征向量为训练数据进行迭代训练。
141.决策树由节点和有向边组成,内部节点表示一个特征或者属性,叶子节点表示一个分类。使用决策树进行分类时,将实例分配到叶节点的类中,该叶节点所属的类就是该节点的分类。在本实施例中,把经过文本特征提取和数据字段归一化处理过的数据合并在一起,得到一个训练集a。然后,依据 3:1的比例,随机把训练集a切割成数据集train和数据集valid。
142.其中,数据集train只用于训练。数据集valid只用于验证模型精度,不拿来训练。
143.决策树执行时,首先进行特征选择,选取有较强分类能力的特征。如果利用某些特征进行分类的结果和随机分类的结果没有很大差别,则称这个特征是没有分类能力的。经验上扔掉这样的特征对决策树学习的精度影响不大。选择特征的标准就是找出局部最优特征作为判断进行切分,取决于切分后节点数据集合中类别的有序程度(纯度),划分后的分区数据越纯,切分规则就越合适。采用cart(基尼系数)来作为分类的纯度的评价指标。
144.然后,将所有的训练样本都放于根节点。然后我们根据一个最优特征将所有训练样本分割成若干个子集,确保各个子集有最好的分类效果。如果分类效果已经达到我们的目的,那我们直接构建叶结点,并且将子集划分到对应的叶结点中。如果分类效果没有达到预先设定的分类目的,则对该子集继续划分。
145.最后,基于数据集train训练1000个step,每200个step就使用数据集 valid验证当前模型的精度(f1指标)。如果当前模型精度比上一次(前200step) 有提升,就保存当前模型的权重。
146.训练1000个step后,算法自动结束,并输出最佳精度模型。
147.最后根据训练完成的决策树,以病患的血液检查的数据字段和病人的症状描述文本为输入,输出对应的疾病分类概率以进行诊断。
148.显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
技术特征:1.一种呼吸道传染病的监测预警系统,其特征在于,包括社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统;所述社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统均包括如下层架构:源数据层,获取源数据;基础资源层,用于提供数据加密服务,根据数据加密需求调用mysql、docker和hyperledger fabric;数据服务层,用于提供查询服务和告警服务,通过知识图谱和规则引擎对源数据进行统计分析;所述数据服务层内存储规则库;数据可视化层,用于可视化数据,调用告警规则根据可视化数据进行告警,同时根据需求对告警规则进行管理。2.根据权利要求1所述的呼吸道传染病的监测预警系统,其特征在于,所述社区监测端子系统实现对社区居民、社区健康监测人群和重点监测行业工作人员基本信息的自行填报,包括人员的基础信息、基础疾病、流行病学史、症状等信息;信息填报完成提交后,系统依据知识图谱及规则引擎诊断,自动反馈诊疗建议及防护建议;数据脱敏后加密发送至群体监测预警子系统。3.根据权利要求2所述的呼吸道传染病的监测预警系统,其特征在于,医院端个体监测系统与院内his系统、pacs系统集成,采集患者诊疗信息,根据知识图谱及规则引擎反馈患者可能患有哪类疾病并给出就诊及防护建议,系统采用多模态模型,向医生提供多阶段预测预警信息,实现早期分诊及早期防护的目标;系统将患者相关信息脱敏后通过加密方式反馈至群体监测预警子系统。4.根据权利要求3所述的呼吸道传染病的监测预警系统,其特征在于,群体监测预警子系统包含可视化、统计分析、告警管理等功能;数据来源于个体监测预警子系统和医院端个体监测系统,基于时空分析技术,从群体角度监测具有特定症候群特征人群的时空聚集性,对疾病的潜在传播实现早期预警,并实现重点数据展示、多维度数据趋势分析、多级别告警管理。5.根据权利要求4中所述的呼吸道传染病的监测预警系统,其特征在于,所述知识图谱知识表示学习的代表模型包括距离模型、单层神经网络模型、双线性模型、神经张量模型、矩阵分解模型和翻译模型;其中,距离模型,首先将实体用向量进行表示,然后通过关系矩阵将实体投影到与实体关系对的向量空间中,最后通过计算投影向量之间的距离来判断实体间已存在的关系的置信度;双线性模型是通过基于实体间关系的双线性变换来刻画实体在关系下的语义相关性;神经张量模型是在不同的维度下,将实体联系起来,表示实体间复杂的语义联系;transe模型是将知识库中实体之间的关系看成是从实体间的某种平移,并用向量表示。6.根据权利要求5中所述的呼吸道传染病的监测预警系统,其特征在于,所述知识图谱进行知识融合时包括
初步筛选,用于初步筛选融合标识符相同的实体数据;判断属性相似度,用于配置相似属性和相似度函数,并判断数据之间的属性相似度;融合知识:对属性相似度均达到阈值条件的数据进行融合;判断实体相似度,根据属性相似度向量得到实体的相似度。7.根据权利要求6所述的呼吸道传染病的监测预警系统,其特征在于,所述知识图谱的存储包括基于表结构的存储和基于图结构的存储;其中,基于表结构的存储,利用二维的数据表对知识图谱中的数据进行存储,包括三元组表、类型表、关系数据库;基于图结构的存储,利用图的方式对知识图谱中的数据进行存储,包括图数据库。8.根据权利要求7所述的呼吸道传染病的监测预警系统,其特征在于,所述数据服务层设有规则引擎,所述规则引擎包括正向链接,基于插入的fact对象和fact对象的更新,利用可用的fact推理规则来提取出更多的fact对象,直到计算出最终目标,最终会有一个或多个规则被匹配,并计划执行;反向链接,从规则引擎假设的结论开始,如果不能够直接满足这些假设,则搜索可满足假设的子目标。9.一种呼吸道传染病的监测预警方法,其特征在于,包括如下步骤:步骤1、社区端采集社区居民、社区健康监测人群和重点监测行业工作人员的基本信息和诊疗信息;医疗端个体监测子系统采集患者基本信息和诊疗信息;所述诊疗信息包括步骤2、根据知识图谱和规则引擎对基本信息和诊疗信息进行诊断,得到基本信息和诊疗信息各自对应的诊疗建议及防护建议;步骤3、对基本信息和诊疗信息进行脱敏和加密处理后上传至群体监测子系统;步骤4、群体监测子系统集中展示经处理后的基本信息和诊疗信息。10.根据权利要求9所述的呼吸道传染病的监测预警方法,其特征在于,步骤4中,展示过程具体为以时间维度、折线图堆叠和柱状图、堆叠区域图进行趋势分析和展示趋势分析、展现。11.根据权利要求9所述的呼吸道传染病的监测预警方法,其特征在于,步骤2中,进行诊断具体包括如下步骤:将基本信息和诊疗信息抽象为症状描述文本,同时和血液检查的数据字段输入至决策树算法内;将症状描述文本进行特征提取后生成对应的512维特征向量;将血液检查的数据字段进行数据归一化处理为血液特征向量;决策树以所述512维特征向量和所述血液特征向量为训练数据进行迭代训练;诊断出对应的疾病分类概率。
技术总结本发明提供一种呼吸道传染病的监测预警系统及方法,包括社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统;社区监测移动端子系统、医院端个体监测子系统和群体监测预警子系统均包括如下层架构:源数据层,获取源数据;基础资源层,用于提供数据加密服务,根据数据加密需求调用MySQL、Docker和Hyperledger Fabric;数据服务层,用于提供查询服务和告警服务,通过知识图谱和规则引擎对源数据进行统计分析;数据服务层内存储规则库;数据可视化层,用于可视化数据,调用告警规则根据可视化数据进行告警,同时根据需求对告警规则进行管理。本发明实现信息来源多渠道、监测预警智慧化、多点触发的目标,以提高应对突发公共卫生事件的应急处置能力。突发公共卫生事件的应急处置能力。突发公共卫生事件的应急处置能力。
技术研发人员:陈航 蒋荣猛 韩冰
受保护的技术使用者:首都医科大学附属北京地坛医院
技术研发日:2022.07.15
技术公布日:2022/11/1