本发明涉及医疗信息技术和数据分析领域,尤其涉及一种结合专家知识和可微分结构的因果分析方法、装置和设备。
背景技术:
1、临床因果分析是解析健康因素与结果间复杂关系的核心,对于指导精准医疗决策至关重要。然而,传统机器学习方法偏重相关性分析,难以揭示因果机制,导致模型可解释性差且难以捕捉临床现象深层原因。贝叶斯网络作为传统因果分析工具,虽有效但易忽视临床数据中细微因果关系变化,影响因果动力学的全面理解。近年来,可微分结构学习及notears算法的兴起,为因果发现带来革新,通过连续学习因果结构增强了灵活性与可扩展性。但面对未观测因素、噪声及临床环境的复杂性,从数据中精准复原因果机制仍是一大挑战。
2、在实际系统中,因果关系可能非常复杂,涉及多个变量和相互作用。正确地建模这些关系并从中提取有意义的因果信息是一个技术难题。另外,一些高级模型可能需要大量的计算资源,这在资源有限的环境中可能是一个问题。优化算法以提高效率和减少资源消耗是一个重要的研究方向。同时动态环境的适应性也是一个问题,现实世界中的系统往往是动态变化的。模型需要能够适应这些变化,以保持其预测和诊断的准确性。
技术实现思路
1、本发明提出了一种结合专家知识和可微分结构的因果分析方法、装置和设备以便克服上述问题。
2、本发明的一个方面,提供了一种结合专家知识和可微分结构的因果分析方法,所述方法用于分析多个目标变量之间的因果关系,所述方法包括:
3、s1、获取数据集、初始的先验知识库和初始的因果关系图,其中,所述数据集中包括多组数据样本,每组数据样本中包含各个目标变量的具体参数;
4、s2、获取专家针对当前的因果关系图的评估信息,根据所述评估信息对先验知识库进行迭代更新;
5、s3、根据更新后的先验知识库对第一notears算法模型进行迭代更新;
6、s4、将所述数据集输入更新后的第一notears算法模型,进行notears迭代优化计算,以对加权邻接矩阵进行迭代更新,根据更新后的加权邻接矩阵对因果关系图进行迭代更新;其中,所述加权邻接矩阵用于表征各个目标变量之间连接关系,所述第一notears算法模型用于将加权邻接矩阵的组合优化问题转换为连续优化问题以对加权邻接矩进行迭代优化;
7、s5、判断更新后的因果关系图是否满足预设的因果关系评估条件,若不满足预设的因果关系评估条件则返回至步骤s2;
8、s6、若满足预设的因果关系评估条件则将更新后的因果关系图作为目标因果关系图。
9、进一步地,所述第一notears算法模型表示为:
10、
11、
12、其中,为可微分结构总损失函数,w为加权邻接矩阵,x为数据集,wc为边缘约束矩阵,为数据近似项,为边缘约束函数为正则化项,h(w)为约束条件;
13、其中,
14、所述数据近似项表示为:
15、
16、其中:m为数据样本的数量,为数据集中第i个数据样本,表示frobenius范数;
17、所述边缘约束函数表示为:
18、
19、其中:θ为加权邻接矩阵的阈值,表示支持边,表示存在边,表示禁止边 ,和为目标变量;
20、所述正则化项表示为:
21、
22、其中:为正则化参数,,表示正则化;
23、所述约束条件表示为:
24、
25、其中:为哈达玛积,tr表示矩阵的迹,n为目标变量的数量。
26、进一步地,所述先验知识库表示为:
27、
28、其中:v代表所有目标变量,集合包含所有存在的边,集合包含所有禁止的边;
29、所述根据更新后的先验知识库对第一notears算法模型进行迭代更新包括:
30、根据更新后的先验知识库对边缘约束矩阵进行迭代更新,使更新后的边缘约束矩阵中与集合对应的矩阵位置为1,与集合对应的矩阵位置为0;
31、将更新后的边缘约束矩阵输入所述边缘约束函数中,以对第一notears算法模型进行迭代更新。
32、进一步地,获取初始的因果关系图包括:
33、将所述数据集输入第二notears算法模型,进行notears迭代优化计算,以获得初始的加权邻接矩阵,将初始的加权邻接矩阵转化为初始的因果关系图;其中,
34、所述第二notears算法模型表示为:
35、
36、其中:为初始可微分结构损失函数。
37、进一步地,所述第一notears算法模型和所述第二notears算法模型的notears迭代优化计算方法相同,所述进行notears迭代优化计算包括:
38、s01、将第一notears算法模型或第二notears算法模型转化为增强拉格朗日算法模型,增强拉格朗日算法模型表示为:
39、
40、
41、其中:表示w为n×n阶矩阵,表示或,α为拉格朗日乘子,ρ为惩罚参数;
42、s02、向所述增强拉格朗日算法模型中输入初始的过渡加权邻接矩阵和初始的拉格朗日乘子,
43、s03、对当前的过渡加权邻接矩阵进行迭代优化计算:
44、,
45、其中,表示为寻找公式中w的最小值,ρ满足,c为进度率,t为迭代次数t=0,1,2,...;
46、s04、对所述拉格朗日乘子进行迭代优化计算:
47、
48、s05、判断是否小于预设的容忍度参数,若不小于则返回至步骤s03;
49、s06、s06、若 小于预设的容忍度参数则中断notears迭代优化计算,将当前的过渡加权邻接矩阵的作为notears迭代优化计算获得的加权邻接矩阵。
50、进一步地,所述对当前的过渡加权邻接矩阵进行迭代优化计算包括:
51、将所述增强拉格朗日算法模型转化为实向量上的典型最小化问题模型:
52、
53、
54、采用l-bfgs优化算法对所述实向量上的典型最小化问题模型进行优化迭代计算。
55、本发明的另一个方面,提供了一种结合专家知识和可微分结构的因果分析装置,所述装置用于分析多个目标变量之间的因果关系,所述装置包括:
56、获取模块,用于获取数据集、初始的先验知识库和初始的因果关系图,其中,所述数据集中包括多组数据样本,每组数据样本中包含各个目标变量的具体参数;
57、专家修正模块,用于获取专家针对当前的因果关系图的评估信息,根据所述评估信息对先验知识库进行迭代更新;
58、模型更新模块,用于根据更新后的先验知识库对第一notears算法模型进行迭代更新;
59、第一优化计算模块,用于将所述数据集输入更新后的第一notears算法模型,进行notears迭代优化计算,以对加权邻接矩阵进行迭代更新,根据更新后的加权邻接矩阵对因果关系图进行迭代更新;其中,所述加权邻接矩阵用于表征各个目标变量之间连接关系,所述第一notears算法模型用于将加权邻接矩阵的组合优化问题转换为连续优化问题以对加权邻接矩进行迭代优化;
60、判断模块,用于判断更新后的因果关系图是否满足预设的因果关系评估条件,若不满足预设的因果关系评估条件则返回至专家修正模块;
61、因果关系确定模块,用于若满足预设的因果关系评估条件则将更新后的因果关系图作为目标因果关系图。
62、进一步地,
63、所述第一notears算法模型表示为:
64、
65、
66、其中,为可微分结构总损失函数,w为加权邻接矩阵,x为数据集,wc为边缘约束矩阵,为数据近似项,为边缘约束函数为正则化项,h(w)为约束条件;
67、其中,所述数据近似项表示为:
68、
69、其中:m为数据样本的数量,为数据集中第i个数据样本,表示frobenius范数;
70、所述边缘约束函数表示为:
71、
72、其中:θ为加权邻接矩阵的阈值,表示支持边,表示存在边,表示禁止边 ,和为目标变量;
73、所述正则化项表示为:
74、
75、其中:为正则化参数,,表示正则化;
76、所述约束条件表示为:
77、
78、其中:为哈达玛积,tr表示矩阵的迹,n为目标变量的数量;
79、所述先验知识库表示为:
80、
81、其中:v代表所有目标变量,集合包含所有存在的边,集合包含所有禁止的边;
82、所述模型更新模块包括:
83、边缘约束矩阵更新子模块,用于根据更新后的先验知识库对边缘约束矩阵进行迭代更新,使更新后的边缘约束矩阵中与集合对应的矩阵位置为1,与集合对应的矩阵位置为0;
84、模型更新子模块,用于将更新后的边缘约束矩阵输入所述边缘约束函数中,以对第一notears算法模型进行迭代更新。
85、进一步地,所述获取模块包括:
86、第二优化计算模块,用于将所述数据集输入第二notears算法模型,进行notears迭代优化计算,以获得初始的加权邻接矩阵,将初始的加权邻接矩阵转化为初始的因果关系图;其中,
87、所述第二notears算法模型表示为:
88、
89、其中:为初始可微分结构损失函数。
90、本发明的另一个方面,提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时,实现如上任一项所述的结合专家知识和可微分结构的因果分析方法的步骤。
91、本技术提供的一种结合专家知识和可微分结构的因果分析方法、装置和设备,该方法根据专家评估获得的先验知识库对第一notears算法模型进行迭代更新,再将数据集输入第一notears算法模型进行notears迭代优化计算,获得迭代更新后的加权邻接矩阵,本发明将专家知识整合到数据驱动的因果发现过程中,不仅利用了大数据的优势,还结合了领域专家的宝贵经验,提高了因果关系的准确性和可靠性。此外,本发明可以持续学习和优化,以更好地反映最新的因果关系发现,具有高灵活性和可扩展性。
92、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
1.一种结合专家知识和可微分结构的因果分析方法,其特征在于,所述方法用于分析多个目标变量之间的因果关系,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一notears算法模型表示为:
3.根据权利要求2所述的方法,其特征在于,所述先验知识库表示为:
4.根据权利要求2所述的方法,其特征在于,获取初始的因果关系图包括:
5.根据权利要求4所述的方法,其特征在于,所述第一notears算法模型和所述第二notears算法模型的notears迭代优化计算方法相同,所述进行notears迭代优化计算包括:
6.根据权利要求5所述的方法,其特征在于,所述对当前的过渡加权邻接矩阵进行迭代优化计算包括:
7.一种结合专家知识和可微分结构的因果分析装置,其特征在于,所述装置用于分析多个目标变量之间的因果关系,所述装置包括:
8.根据权利要求7所述的装置,其特征在于,
9.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时,实现如权利要求1-6中任一项所述的结合专家知识和可微分结构的因果分析方法。
