1.本技术属于医疗设备技术领域,具体地讲,涉及一种基于心电图诊断报告的心搏分类方法及装置。
背景技术:2.心律失常对应于心电图中心率的异常或波形的异常,其中后者的诊断更加困难。心搏是心电图的基本组成单元,因此,心搏级别的诊断相较于心电图级别的诊断具有更强的可解释性,从而更受临床的需要。
3.训练一个心搏级别的分类器通常需要心搏级别的标注数据,而这种标注在现实中是罕见的,通常只能为此特地去标注。同时,这一标注成本巨大。因此,限制心搏分类器的瓶颈在于心搏级别数据的标注。另一方面,尽管心搏级别的标注在现实中非常罕见,但现实中并不缺乏心电图级别的标注:几乎每个病人的常规心电图检查都会有一份诊断报告,而标注可以从诊断报告中提取得到。图1为心电图级别标注(rhythm-level label)和心搏级别标注(heartbeat-level label)的关系。
技术实现要素:4.本技术提供了一种基于心电图诊断报告的心搏分类方法及装置,以至少解决当前市面上因为缺乏心搏级别的标注而导致无法仅通过带有心电图级别标注的数据来完成心搏分类的问题。
5.根据本技术的第一个方面,提供了一种基于心电图诊断报告的心搏分类方法,包括:
6.获取心电图数据;
7.将单个心搏的心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。
8.在一实施例中,心搏分类模型的训练方法包括:
9.将收集的常规心电图训练样本输入预先训练好的节律网络模型中,获得心电热力图;
10.对心电热力图中的每个心搏标注伪标签及标签置信度;
11.根据标注后的心搏生成伪心搏级别训练集;
12.利用带有置信度的伪心搏级别训练集训练心搏分类模型。
13.在一实施例中,节律网络模型的训练方法包括:
14.将带有全局类别标注的常规心电图训练样本输入节律网络模型中;
15.所述节律网络模型推断出输入常规心电图的全局类别标注。
16.在一实施例中,节律网络在公开的resnet34基础上增加一u形结构和一attention池化层。
17.根据本技术的另一个方面,还提供了一种基于心电图诊断报告的心搏分类装置,包括:
18.获取单元,用于获取心电图数据;
19.心搏分类单元,用于将单个心搏的心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。
20.在一实施例中,基于心电图诊断报告的心搏分类装置还包括一心搏分类模型的训练装置,具体包括:
21.心电热力图获取单元,用于将收集的常规心电图训练样本输入预先训练好的节律网络模型中,获得心电热力图;
22.标注单元,用于对心电热力图中的每个心搏标注伪标签及标签置信度;
23.心搏训练集生成单元,用于根据标注后的心搏生成伪心搏级别训练集;
24.第一训练单元,用于利用带有置信度的伪心搏级别训练集训练心搏分类模型。
25.在一实施例中,基于心电图诊断报告的心搏分类装置还包括节律网络模型的训练装置,具体包括:
26.训练样本输入单元,用于将常规心电图训练样本输入节律网络模型中;
27.全局类别标注单元,用于节律网络模型将心电图进行全局类别标注;
28.在一实施例中,节律网络在公开的resnet34基础上增加一u形结构和一attention池化层。
29.目前现有技术只能解决两个问题:如何用心电图级别标注数据训练心电图分类器以及如何用心搏级别标注数据训练心搏分类器。本技术通过将节律网络模型和心搏网络模型进行结合,实现了用心电图级别的标注数据即可训练心搏分类器的功能。
附图说明
30.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1为心电图级别标注(rhythm-level label)和心搏级别标注(heartbeat-level label)的关系。
32.图2为本技术提供的一种基于心电图诊断报告的心搏分类方法流程图。
33.图3为本技术实施例中心搏分类模型的训练方法的流程图。
34.图4为本技术实施例中节律网络模型的训练方法流程图。
35.图5为本技术实施例中节律网络的具体结构.
36.图6为本技术实施例中心搏分类网络的具体结构。
37.图7为本技术提供的一种基于心电图诊断报告的心搏分类装置的结构框图。
38.图8为本技术实施例中心搏分类模型的训练装置的结构框图。
39.图9为本技术实施例中节律网络模型的训练装置的结构框图。
40.图10为本技术实施例中一种电子设备的具体实施方式。
具体实施方式
41.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
42.心律失常对应于心电图中心率的异常或波形的异常,其中后者的诊断更加困难。心搏是心电图的基本组成单元,因此,心搏级别的诊断相较于心电图级别的诊断具有更强的可解释性,从而更受临床的需要。
43.训练一个心搏级别的分类器通常需要心搏级别的标注数据,而这种标注在现实中是罕见的,通常只能为此特地去标注。同时,这一标注成本巨大。因此,限制心搏分类器的瓶颈在于心搏级别数据的标注。另一方面,尽管心搏级别的标注在现实中非常罕见,但现实中并不缺乏心电图级别的标注:几乎每个病人的常规心电图检查都会有一份诊断报告,而标注可以从诊断报告中提取得到。目前现有技术大多孤立地研究上述两个问题,即:如何用心电图级别标注数据训练心电图分类器以及如何用心搏级别标注数据训练心搏分类器。因此,本技术所要解决的问题是如何仅利用带有心电图级别标注的数据来完成心搏级别的分类器训练。
44.根据本技术的一个方面,提供了一种基于心电图诊断报告的心搏分类方法,如图2所示,包括:
45.s201:获取心电图数据。
46.s202:将单个心搏的心电图数据输入预先训练的心搏分类模型中获得心搏分类结果。其中,心搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。
47.在一实施例中,如图3所示,心搏分类模型的训练方法包括:
48.s301:将收集常规心电图训练样本输入预先训练好的节律网络模型中,获得心电热力图。
49.s302:对心电热力图中的每个心搏标注伪标签及标签置信度。
50.s303:根据标注后的心搏生成伪心搏级别训练集。
51.s304:利用带有置信度的伪心搏级别训练集训练心搏分类模型。
52.在一实施例中,如图4所示,节律网络模型的训练方法包括:
53.s401:将带有全局类别标注的常规心电图训练样本输入节律网络模型中。
54.s402:节律网络模型推断出输入常规心电图的全局类别标注。
55.在一实施例中,节律网络增加一u形结构和一attention池化层。
56.在一具体实施例中,一段心电图被诊断为异常,当且仅当其中含有至少一个异常的心搏。反之,一段心电图被诊断为正常,当且仅当其中所有心搏均为正常。这与机器学习中的多实例学习(multiple instance learning)建模一致,因此,基于多实例学习进行方法设计。本技术将训练两个神经网络模型:节律网络(rhythm-level net)和心搏网络(heartbeat-level net),后者为最终的目标模型,而前者为后者的训练提供支持。
57.在一具体实施例中,节律网络的结构基于attention u-net,它是扩展版的卷积神经网络。它接受一段心电图作为输入。训练时,它需要心电图相应的全局类别标注;而在推
断时,它不仅可以推断心电图的全局类别,还可以生成一张热力图用于定位异常类别的相应区域。在卷积神经网络中中间特征层的每一个位置均对应于原始输入的一段连续数据(即感受野),本技术把这样的连续数据建模为单个实例,从而整体模型可以用多实例学习来建模。相较于普通的卷积神经网络,它包含两个改进:(1)引入u形结构,它是一种常见于语义分割网络的结构,其目的是生成细粒度的热力图。(2)引入attention池化层,它是一种新颖的多实例学习的集成函数,可用于显式建模每个位置对最终分类影响的权重,这一权重也会很大程度地影响生成的热力图。利用节律网络生成的热力图,可以为每个心搏打上伪标签及其标签置信度,其伪标签的定义是:任何一个异常的心电图,其所有心搏都被打上相应异常的伪标签;置信度的定义是:热力图中在该心搏区域的面积的归一化值(0-1区间内)。如此,可以得到一个伪心搏级别训练集,用于接下来的训练。
58.图5为节律网络的具体结构,每一个卷积层后附带一个批归一化层。
59.在一具体实施例中,心搏网络的结构基于一个6层卷积神经网络。它接受一个心搏作为输入。训练时,它利用上述得到的伪心搏级别训练集进行训练;推断时,它如同正常的分类器一样推断出新的心搏所属类别。这里的技术关键在于如何利用带有置信度的数据集进行分类器训练。本技术提出了一种带权重的交叉熵损失函数,设某样本置信度为s,原始交叉熵损失值为ce,则带权损失函数定义为s
α
ce,其中α为一个非负超参数用于控制置信度的缩放。
60.图6为心搏网络的具体结构,每个卷积层后都跟着一个层归一化层。
61.在一具体实施例中,训练心搏网络时用的超参数α取1.0可得最佳性能,但我们通过实验证明了实际效果对该超参数选取并不敏感,α取[0.5,1000]内的值均未导致性能发生明显变化。训练节律网络时,使用adam优化器,其中的内置参数为默认值β1=0.9,β2=0.999),学习率为0.0003,批大小为64。训练心搏网络时,使用adam优化器,其中的内置参数为默认值(β1=0.9,β2=0.999),学习率为0.0003,批大小为128。
[0062]
通常情况下,包括四种心律失常:室上性心律失常、室性心律失常、右束支传导阻滞、左束支传导阻滞。这四种心律失常与正常类共同构成了五种类别。本技术使用了约6万段24秒的心电图(仅带有心电图级别标注)进行模型训练,使用了约2万个心搏(带有心搏级别标注)进行模型测试,最终在心搏网络上的测试平均f1分数为0.807。作为对比,在上述心搏测试集上用同样的模型进行五折交叉验证训练,最终得到的平均f1分数为0.739。考虑到现实中获取2万个心搏标注难度较高,这一结果表明本技术提供的方法可以充分利用现实中存在的数据,并训练出效果优异的模型。
[0063]
基于同一发明构思,本技术实施例还提供了一种基于心电图诊断报告的心搏分类装置,可以用于实现上述实施例中所描述的方法,如下面实施例所述。由于该基于心电图诊断报告的心搏分类装置解决问题的原理与基于心电图诊断报告的心搏分类方法相似,因此基于心电图诊断报告的心搏分类装置的实施可以参见基于心电图诊断报告的心搏分类方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0064]
根据本技术的另一个方面,还提供了一种基于心电图诊断报告的心搏分类装置,如图7所示,包括:
[0065]
获取单元701,用于获取心电图数据;
[0066]
心搏分类单元702,用于将单个心搏的心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。
[0067]
在一实施例中,基于心电图诊断报告的心搏分类装置还包括一心搏分类模型的训练装置,如图8所示,具体包括:
[0068]
心电热力图获取单元801,用于将收集的常规心电图训练样本输入预先训练好的节律网络模型中,获得心电热力图;
[0069]
标注单元802,用于对心电热力图中的每个心搏标注伪标签及标签置信度;
[0070]
心搏训练集生成单元803,用于根据标注后的心搏生成伪心搏级别训练集;
[0071]
第一训练单元804,用于利用带有置信度的伪心搏级别训练集训练心搏分类模型。
[0072]
在一实施例中,基于心电图诊断报告的心搏分类装置还包括节律网络模型的训练装置,如图9所示,具体包括:
[0073]
训练样本输入单元901,用于将常规心电图训练样本输入节律网络模型中;
[0074]
全局类别标注单元902,用于节律网络模型将心电图进行全局类别标注;
[0075]
在一实施例中,节律网络在公开的resnet34基础上增加一u形结构和一attention池化层。
[0076]
目前现有技术只能解决两个问题:如何用心电图级别标注数据训练心电图分类器以及如何用心搏级别标注数据训练心搏分类器。本技术通过将节律网络模型和心搏网络模型进行结合,实现了用心电图级别的标注数据即可训练心搏分类器的功能。
[0077]
本技术的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式,参见图10,所述电子设备具体包括如下内容:
[0078]
处理器(processor)1001、内存1002、通信接口(communications interface)1003、总线1004和非易失性存储器1005;
[0079]
其中,所述处理器1001、内存1002、通信接口1003和非易失性存储器1005通过所述总线1004完成相互间的通信;
[0080]
所述处理器1001用于调用所述内存1002和非易失性存储器1005中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
[0081]
s201:获取心电图数据。
[0082]
s202:将心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。
[0083]
本技术的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
[0084]
s201:获取心电图数据。
[0085]
s202:将心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心
搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。
[0086]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施
例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。
技术特征:1.一种基于心电图诊断报告的心搏分类方法,其特征在于,包括:获取心电图数据;将单个心搏的所述心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;所述心搏分类模型通过节律网络和心电图级别标注数据进行训练。2.根据权利要求1所述的基于心电图诊断报告的心搏分类方法,其特征在于,心搏分类模型的训练方法包括:将收集的常规心电图训练样本输入预先训练好的节律网络模型中,获得心电热力图;对所述心电热力图中的每个心搏标注伪标签及标签置信度;根据标注后的心搏生成伪心搏级别训练集;利用带有置信度的所述伪心搏级别训练集训练所述心搏分类模型。3.根据权利要求2所述的基于心电图诊断报告的心搏分类方法,其特征在于,节律网络模型的训练方法包括:将带有全局类别标注的所述常规心电图训练样本输入节律网络模型中;所述节律网络模型推断出输入常规心电图的全局类别标注。4.根据权利要求1所述的基于心电图诊断报告的心搏分类方法,其特征在于,所述节律网络在公开的resnet34基础上增加一u形结构和一attention池化层。5.一种基于心电图诊断报告的心搏分类装置,其特征在于,包括:获取单元,用于获取心电图数据;心搏分类单元,用于将单个心搏的所述心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;所述心搏分类模型通过节律网络和心电图级别标注数据进行训练。6.根据权利要求5所述的基于心电图诊断报告的心搏分类装置,其特征在于,还包括一心搏分类模型的训练装置,具体包括:心电热力图获取单元,用于将收集的常规心电图训练样本输入预先训练好的节律网络模型中,获得心电热力图;标注单元,用于对所述心电热力图中的每个心搏标注伪标签及标签置信度;心搏训练集生成单元,用于根据标注后的心搏生成伪心搏级别训练集;第一训练单元,用于利用带有置信度的所述伪心搏级别训练集训练所述心搏分类模型。7.根据权利要求6所述的基于心电图诊断报告的心搏分类装置,其特征在于,还包括节律网络模型的训练装置,具体包括:训练样本输入单元,用于将所述常规心电图训练样本输入节律网络模型中;全局类别标注单元,用于所述节律网络模型将心电图进行全局类别标注。8.根据权利要求5所述的基于心电图诊断报告的心搏分类装置,其特征在于,所述节律网络在公开的resnet34基础上增加一u形结构和一attention池化层。9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4任一项所述的基于心电图诊断报告的心搏分类方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4任一项所述的基于心电图诊断报告的心搏分类方法的步骤。
技术总结本发明提供了一种基于心电图诊断报告的心搏分类方法及装置,方法包括:获取心电图数据;将心电图数据输入预先训练的心搏分类模型中获得心搏分类结果;其中,心搏分类模型为六层卷积神经网络;心搏分类模型通过节律网络和心电图级别标注数据进行训练。目前现有技术只能解决两个问题:如何用心电图级别标注数据训练心电图分类器以及如何用心搏级别标注数据训练心搏分类器。本申请通过将节律网络模型和心搏网络模型进行结合,实现了用心电图级别的标注数据即可训练心搏分类器的功能。标注数据即可训练心搏分类器的功能。标注数据即可训练心搏分类器的功能。
技术研发人员:陈挺 张轩
受保护的技术使用者:清华大学
技术研发日:2022.07.25
技术公布日:2022/11/1