本发明涉及图像处理,更具体地,涉及一种无源域医疗图像深度学习模型渐进自适应方法。
背景技术:
1、医学图像已成为临床医生进行诊断和治疗时的重要参考,但医学图像的采集和生成是一个复杂过程,包含图像获取、存储、处理等多个环节。这些环节的稳定性和一致性直接影响最终医学图像的视觉效果。当图像生成流程发生变动时,医学图像也会发生相应变化。尽管图像外观的改变可能影响医生的判读,但依靠丰富的临床经验,医生仍能适应这些变化,从而正确理解图像并做出准确诊断。
2、近年来,深度学习算法在医学图像分析中的应用日益广泛,但其泛化能力的局限性也逐渐显现。核心问题是深度学习模型对训练数据的拟合性过强,而对数据分布变化的适应性较差。具体来说,用于训练模型的数据集可以看作源域,而模型需要作预测的新数据集则是目标域。两者在视觉表现上可能存在差异,即两个不同的分布,这就是所谓的域偏移现象。当域偏移发生时,在源域数据集上训练的模型难以适应目标域中图像的新变化,其性能会明显下降。这种过度依赖训练数据分布的脆弱性,使得深度学习模型的泛化能力受到限制,难以在临床中推广应用。
3、受限于多医疗机构间因隐私保护无法共享图像数据,以及医学图像精确标注的高昂人工成本,构建大规模跨医疗中心的医学图像数据集以训练深度学习模型应用于临床面临诸多困难。此外,现有基于源域自适应的算法需要获取源域数据集以适应目标域,但不同医疗机构出于隐私考虑无法共享其中心数据,导致这类算法失去源域数据支持,很难实际应用。考虑到上述限制,可以将模型部署到新医疗中心的场景简化为两种情况:“场景一”是目标域仅有无标注的医学图像;“场景二”是指目标域含有标注的医学图像。
4、无源域数据下的域自适应算法是解决“场景一”问题而提出来的。然而,现有解决“场景一”的技术方案仍然存在一些问题。在技术层面上:基于伪标签自训练的方案高度依赖生成的伪标签质量,由于伪标签是模型自己生成的,所以难免会引入一定的噪声,这可能会误导模型训练。基于图像翻译的技术方案,该技术方案在图像翻译过程中,缺乏图像语义内容方面的约束,因此很难完全保持语义内容不变,一些细微语义信息很容易在转换过程中丢失。采用构建超级目标域与特征对齐的方案依赖于获取高质量的超级目标域图像,当超级目标域图像的分布范围能够较为完整地覆盖源域图像分布时,才会产生较好的性能。此外,现有大部分技术方案仅关注算法对目标域图像的适应性,忽略了对源域数据的性能。且部分算法存在多个步骤,这种方式的弊端是若其中某一步骤若出现较大误差,则会影响整体算法的有效性,各个步骤之间无法独立。在实际应用方面上,现有技术方案大多针对一种图像分析任务(图像分类、图像分割或目标检测等),在任务通用性方面较差。此外,现有发明仅仅关注到无监督场景下的对目标域图像的适应,但是无监督适应后的模型性能相比于监督学习下训练模型的性能仍然具有一定差距,这在真实临床场景下依旧难以接受。
5、迁移学习是决绝“场景二”下问题的常见方式。其中迁移学习是指用目标域的标注数据微调源域数据的模型,使模型能够更好适应目标域数据性能。但是该方案仍然存在一定缺点,即微调的模型在适应新的目标域中心数据后,会“遗忘”源域数据的分布情况,导致模型在源域数据上的性能降低,泛化性下降。
技术实现思路
1、本发明的目的之一是提供一种无源域医疗图像深度学习模型渐进自适应方法,在“场景一”下,提高深度学习模型在目标域图像上的业务性能;本发明的本发明的目的之一是提供一种无源域医疗图像深度学习模型渐进自适应方法,在“场景二”下,提高深度学习模型在目标域图像上的业务性能
2、为解决上述技术问题,本发明的技术方案如下:
3、本发明第一方面提供一种无源域医疗图像深度学习模型渐进自适应方法,当收集的目标域图像无标注时,包括以下步骤:
4、获取已应用于源域图像医学图像分析任务中的第一深度学习模型;
5、根据所述第一深度学习模型,分别构建第一域自适应框架和第二域自适应框架,所述第一域自适应框架和第二域自适应框架分别将目标域图像风格转化为源域图像风格后,对所述第一深度学习模块的参数进行调整;
6、使用无标注的目标域图像,构建无监督目标域图像数据集;
7、搜集与所述无标注的目标域图像相同类型的公开数据集,并将所述公开数据集与所述无监督目标域图像数据集合并为增强数据集;
8、使用所述无监督目标域图像数据集和增强数据集训练所述第一域自适应框架,得到训练好的第一域自适应框架,并得到第一图像生成器与第二深度学习模型;
9、利用第一图像生成器和第二深度学习模型对所述无标注的目标域图像进行处理,得到带有伪标签的目标域图像;
10、使用所述带有伪标签的目标域图像,并对所述伪标签进行检查修正,构建监督目标域图像数据集;
11、使用所述监督目标域图像数据集和增强数据集训练所述第二域自适应框架,得到训练好的第二域自适应框架,并得到第三图像生成器和第三深度学习模型;
12、利用第三图像生成器将待分析的目标域图像的风格转化为源域图像风格后,将转换后的待分析的目标域图像输入所述第三深度学习模型,得到分析结果。
13、进一步的,所述第一域自适应框架包括第一多尺度图像重建模块,所述第一多尺度图像重建模块用于将目标域图像风格转化为源域图像风格,所述第一多尺度图像重建模块包括第一图像生成器和第二图像生成器,其中:
14、所述第一图像生成器的输入为目标域图像,所述第一图像生成器的输出为具有源域图像风格的目标域图像;
15、所述第二图像生成器的输入为所述具有源域图像风格的目标域图像,所述第二图像生成器的输出为重建后的具有目标域图像风格的目标域图像。
16、进一步的,所述第一域自适应框还包括第一风格特征对齐模块,所述第一风格特征对齐模块基于所述第一深度学习模型,其中:
17、从所述第一深度学习模型中的batch normalization层中获取源域图像风格信息;
18、将所述第一图像生成器的输出图像输入至所述第一深度学习模型中,得到所述第一图像生成器的输出图像的图像风格特征信息;
19、根据所述源域图像风格信息和图像风格特征信息,计算图像风格损失,所述图像风格损失用于约束所述第一图像生成器。
20、进一步的,使用所述无监督目标域图像数据集和增强数据集训练所述第一域自适应框架,包括使用所述无监督目标域图像数据集训练所述第一图像生成器和第二图像生成器,包括:
21、整图重建:将目标域图像输入至图像第一图像生成器gt→n中,图像第一图像生成器gt→n的输出为并且对做如下处理得到图像
22、
23、将输入至与所述第一图像生成器gt→n相同类型的第二图像生成器gn→r中,所述第二图像生成器gn→r的输出为图像计算重建损失lrebuild_f对图像进行约束,使图像的视觉外观与目标域图像的差异度小于预设阈值,重建损失lrebuild_f为l1损失函数,计算方式为:
24、
25、patch图像重建:将目标域图像采用随机裁剪的方式得到patch图像,将patch图像输入至所述第一图像生成器gt→n后得到图像再将图像输入至所述第二图像生成器gn→r中得到图像采用重建损失lrebuild_p对图像进行约束,计算方式如下:
26、
27、多尺度图像重建的损失函数lrebuild为:
28、lrebuild=lrebuild_f+lrebuild_p
29、将图像输入至所述第一深度学习模型中,计算图像风格损失lwassertauin:
30、
31、式中,和分别代表将图像输入至第一深度学习模型后,对第m个批归一化层前的特征图进行计算得到的平均值与标准差;t表示当前训练的迭代次数,t-1表示上一次训练的迭代次数,α是用来平衡迭代次数为t时的统计量和与迭代次数为t-1时的统计量和之间的超参数;与分别是源域数据训练的第一深度学习模型中第m个批归一化层中存储的平均值与标准差;||·||2表示l2损失函数;
32、利用所述损失函数lrebuild和lwassertauin训练所述第一图像生成器和第二图像生成器。
33、进一步的,训练所述第一图像生成器和第二图像生成器还包括计算改进的总变分损失函数losstv,如下:
34、losstv=losschannel+lossspatial
35、式中,lossspatial为图像空间的损失函数,losschannel为图像通道的损失函数,其中:
36、
37、式中,h、w分别表示图像在y轴与x轴的坐标,sum表示求和函数,||表示绝对值,表示在图像中从y轴0到h-1,在x轴0到w所取出的矩阵区域;表示在图像中从y轴1到h,在x轴0到w所取出的矩阵区域;表示在图像中从y轴0到h,在x轴0到w-1所取出的矩阵区域;表示在图像中从y轴0到h-1,在x轴1到w所取出的矩阵区域;
38、
39、
40、式中,r、g、b分别表示图像的rgb三个通道。
41、进一步的,所述第一域自适应框架还包括第一持续学习模块和第二持续学习模块,其中:
42、所述第一持续学习模块包括第一深度学习模型和第二深度学习模型,所述第二深度学习模型以所述第一深度学习模型的参数权重进行初始化,并在训练中更新权重;
43、所述第一持续学习模块中,所述第二深度学习模型的输入为图像所述第一深度学习模型的输入为目标域图像根据所述第二深度学习模型和所述第一深度学习深度模型的输出计算拟合损失,约束所述第二深度学习模型和所述第一深度学习深度模型的输出保持一致;
44、所述第二持续学习模块包括第二深度学习模型和第一深度学习模型,所述第一深度学习模型在训练中保持参数权重不变;
45、所述第二持续学习模块中,所述第二深度学习模型和所述第一深度学习模型的输入均为增强数据集中的图像,根据所述第二深度学习模型和所述第一深度学习深度模型的输出计算拟合损失,约束所述第二深度学习模型和所述第一深度学习深度模型的输出保持一致。
46、进一步的,所述拟合损失为任一拟合函数。
47、进一步的,所述利用第一图像生成器和第二深度学习模型对所述无标注的目标域图像进行处理,得到带有伪标签的目标域图像,包括:
48、利用第一图像生成器将目标域图像转化为具有源域图像特征的目标域图像,利用第二深度学习模型对具有源域图像特征的目标域图像处理,得到带有伪标签的目标域图像。
49、进一步的,所述第二域自适应框架包括第二多尺度图像重建模块、第二风格特征对齐模块、目标域图像监督学习模块和第三持续学习模块,其中:
50、所述第二多尺度图像重建模块包括第三生成器和第四生成器,所述第二多尺度图像重建模块与所述第一多尺度图像重建模块结构相同,第二风格特征对齐模块与所述第一风格特征对齐模块结构相同;
51、所述第三持续学习模块包括第三深度学习模型和第一深度学习模型,所述第一深度学习模型在训练中保持参数权重不变;
52、所述第三持续学习模块中,所述第三深度学习模型和所述第一深度学习模型的输入均为增强数据集中的图像,根据所述第三深度学习模型和所述第一深度学习深度模型的输出计算拟合损失,约束所述第三深度学习模型和所述第一深度学习深度模型的输出保持一致;
53、所述目标域图像监督学习模块包括第三深度学习模型,所述第三深度学习模型以所述第一深度学习模型的参数权重进行初始化,并在训练中更新权重,在将图输入至第三深度学习模型后,得到第三深度学习模型的输出,约束第三深度学习模型的输出与监督目标域图像数据集中的图像标注保持一致。
54、本发明的第二方面提供一种无源域医疗图像深度学习模型渐进自适应方法,其特征在于,当收集的目标域图像带有标注时,有以下步骤:
55、使用所述带有标注的目标域图像,构建监督目标域图像数据集;
56、使用所述监督目标域图像数据集和增强数据集训练所述第二域自适应框架,得到训练好的第二域自适应框架,并得到第三图像生成器与第三深度学习模型;
57、利用第三图像生成器将待分析的目标域图像的风格转化为源域图像风格后,将转换后的待分析的目标域图像输入所述第三深度学习模型,得到分析结果。
58、与现有技术相比,本发明技术方案的有益效果是:
59、(1)相比于现有技术只能解决“场景一”或“场景二”单一场景下的问题,本发明提出的解决方案系统性解决了“场景一”和“场景二”下两个场景的问题;
60、(2)相比之前仅关注于提升深度学习模型在目标域上的业务性能,本发明提出的方法不仅可以提高深度学习模型在目标域图像上的业务性能,同时也可以保持模型在源域图像上的业务性能;
61、(3)本发明提出的框架采用端到端的训练策略,这种流水线方法减少了误差传播,并更加聚焦和有效地优化全局学习目标,最终以更加资源高效的方式产生卓越的结果;
62、(4)相比于之前的发明只能应用到图像分割、图像分类等某一个计算机视觉任务中,本发明所提出的框架可以与任何一种计算机视觉任务(图像分类、图像分割、目标检测)相结合,因此本框架具有更强的任务通用性;
63、(5)针对目前无监督域自适应算法在适应新中心后性能依然不足以满足临床需求的问题,本发明提出了一套从无监督到半监督逐步优化的部署方案。先利用无监督算法对新中心图像进行适应并产生为标签,降低临床医生的数据标注工作量。再利用标注后的数据训练半监督算法,进一步提升模型性能以至于达到临床需求。
1.一种无源域医疗图像深度学习模型渐进自适应方法,其特征在于,当收集的目标域图像无标注时,包括以下步骤:
2.根据权利要求1所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,所述第一域自适应框架包括第一多尺度图像重建模块,所述第一多尺度图像重建模块用于将目标域图像风格转化为源域图像风格,所述第一多尺度图像重建模块包括第一图像生成器和第二图像生成器,其中:
3.根据权利要求2所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,所述第一域自适应框还包括第一风格特征对齐模块,所述第一风格特征对齐模块基于所述第一深度学习模型,其中:
4.根据权利要求3所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,使用所述无监督目标域图像数据集和增强数据集训练所述第一域自适应框架,包括使用所述无监督目标域图像数据集训练所述第一图像生成器和第二图像生成器,包括:
5.根据权利要求4所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,训练所述第一图像生成器和第二图像生成器还包括计算改进的总变分损失函数losstv,如下:
6.根据权利要求1所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,所述第一域自适应框架还包括第一持续学习模块和第二持续学习模块,其中:
7.根据权利要求6所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,所述拟合损失为任一拟合函数。
8.根据权利要求6所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,所述利用第一图像生成器和第二深度学习模型对所述无标注的目标域图像进行处理,得到带有伪标签的目标域图像,包括:
9.根据权利要求8所述的无源域医疗图像深度学习模型渐进自适应方法,其特征在于,所述第二域自适应框架包括第二多尺度图像重建模块、第二风格特征对齐模块、目标域图像监督学习模块和第三持续学习模块,其中:
10.一种无源域医疗图像深度学习模型渐进自适应方法,其特征在于,当收集的目标域图像带有标注时,有以下步骤:
