本发明涉及医学数据分析领域,特别是涉及一种通过混合效应模型预测疾病下降率的方法。
背景技术:
1、乙肝,作为一种全球性的健康问题,影响着数亿人的生活质量。hbsag(乙型肝炎表面抗原)是乙型肝炎病毒感染的关键生物标志物,治疗过程中不同时相点hbsag水平相对基线的下降率不仅反映了患者的临床病程状态,也与治疗策略的适时调整和临床理想应答结局密切相关。现有关于hbsag水平的研究大多集中于动力学评估方面,且hbsag水平消失或降低的可靠预测因子尚未建立,仅有少数针对非活动期chb患者的hbsag动态水平预测研究。因此,临床辅助决策亟需开发各治疗时刻hbsag水平相对基线的下降率的实时预测模型,为患者达到更好的功能性治愈临床结局提供帮助。
2、本发明的目的在于开发一个能够较好地实时预测患者在治疗过程中hbsag水平相对基线的下降率的统计预测模型。具体地,首先利用组轨迹模型识别出异质性患者群体中的不同潜在类别,再利用混合效应回归技术得到各治疗时刻hbsag水平下降率的时间效应预测模型。最后,在混合效应回归中耦合组轨迹模型,得到新的时间加组双效应预测模型,用以预测患者未来的hbsag水平相对基线的下降率,提高预测精度。
技术实现思路
1、基于此,有必要针对现有预测hbsag水平下降率的方法存在局限性的问题,提供一种通过混合效应模型预测疾病下降率的方法。
2、一种通过混合效应模型预测疾病下降率的方法,包括以下步骤:
3、s1、输入患者的基本信息和时序检测数据;
4、s2、基于患者的时序检测数据,计算患者每个检测时刻的hbsag水平相对基线的下降率;
5、s3、建立组轨迹模型,使用条件概率公式计算患者属于不同异质性潜在类别组的概率,判断患者最可能属于的异质性潜在类别组;
6、s4、建立时间效应预测模型,利用患者的hbsag水平下降率数据,预测患者未来的hbsag水平下降趋势;
7、s5、将时间效应预测模型和组轨迹模型耦合,提高患者未来的hbsag水平下降率的预测精度。
8、本技术公开了一种通过混合效应模型预测疾病下降率的方法,通过根据患者的基本信息和时序检测数据,为每个患者提供个性化的hbsag水平下降率预测,从而更准确地反映个体差异。建立组轨迹模型,使用条件概率公式计算患者属于不同异质性潜在类别组的概率,判断患者最可能属于的异质性潜在类别组,有助于医生更好地理解不同患者的疾病进展模式,并为不同组别的患者提供更有针对性的治疗建议。通过时间效应预测模型,能够预测患者未来的hbsag水平变化趋势,有助于医生提前了解患者的病情变化,为治疗调整提供依据。将时间应预测模型和组轨迹模型相结合,可以更加准确地预测患者未来的hbsag水平下降率,这种混合效应模型预测未来hbsag水平下降率的方法考虑了患者的个体差异和时间的动态变化,提高了预测的精度和可靠性。
9、上述任一技术方案中,所述步骤s2中,下降率由下式计算:
10、
11、其中,表示基线hbsag水平,表示第t个检测时刻周时的hbsag水平,表示患者i在第t个检测时刻周的hbsag水平相对基线的下降率。
12、通过引入基线hbsag水平和第t个检测时刻的hbsag水平,计算疾病的下降率,使得预测结果更加接近实际情况。对患者特定时间点的hbsag水平进行预测,可以为患者制定个体化的治疗方案,优化治疗效果,减少不必要的药物使用和副作用,还能够及时预测疾病的下降率,帮助医生及早识别病情变化并采取相应的干预措施。由于使用了线性混合效应模型,可以在预测后设置合理的调整机制,避免预测结果出现不符合实际情况的情况。
13、上述任一技术方案中,所述步骤s3中,所述异质性潜在类别组包括快速高清除组、延时高清除组和缓慢低清除组。
14、通过将患者分为不同的异质性潜在类别组,可以更准确地捕捉不同患者群体的疾病下降率特征,这种分组方法有助于识别不同患者群体的特定需求和反应,从而提高预测模型的准确性。同时,对不同潜在类别组进行划分,可以获取更多关于疾病进程的信息,例如,快速高清除组可能代表疾病恢复迅速的个体,而缓慢低清除组可能代表疾病恢复较慢的个体,这些信息对于制定针对性的治疗策略和评估治疗效果具有重要意义。
15、上述任一技术方案中,所述步骤s3中,
16、对患者i,其检测时间点为(wi,0,wi,1,wi,2,…,wi,t),其中,wi,0表示入院诊疗时刻,记为0周,wi,1表示入院诊疗后第一个检测时刻周数,wi,2表示入院治疗后第二个检测时刻周数,wi,t表示该患者在入院后第t个检测时刻周数,wi,0,wi,1,wi,2,…,wi,t不一定为连续正整数;各检测时刻周的hbsag水平相对基线的实际下降率为由下式计算而得:
17、
18、其中,表示基线hbsag水平,表示第t个检测时刻周时的hbsag水平,表示患者i在第t个检测时刻周的hbsag水平相对基线的下降率;
19、根据
20、
21、计算得到该患者i在分属不同的异质性潜在类别组时,各检测时刻周的hbsag水平相对基线的预测下降率,记为和
22、记t=count{wi,1,wi,2,…,wi,t},表示除基线检测时间外的检测时间点数目,由条件概率公式:
23、
24、计算得到患者i分属不同的异质性潜在类别组的概率值,其中σ1=0.17052475、σ2=0.28058448、σ3=0.30667541,yi,t表示患者i在第t个检测时刻时hbsag水平相对基线的下降率,为患者i在第t个检测周时属于轨迹组j的hbsag水平相对基线的预测下降率,φ(x)为标准正态累积分布函数,其计算公式为
25、比较由条件概率公式计算得到的三个条件概率值p(j|yi),j=1,2,3,其中,患者i属于最大条件概率值对应的异质性潜在类别组。
26、通过考虑患者不同检测时刻周的hbsag水平相对基线的实际下降率,能够为每个患者提供个性化的疾病下降率预测,从而更准确地评估治疗效果和疾病进展。利用条件概率公式计算患者分属不同异质性潜在类别组的概率值,以判断患者所属的异质性潜在类别组,有助于进一步研究不同群体的疾病特征和治疗反应,为疾病的基础研究和临床应用提供支持。该方法允许患者检测时间点不连续,充分利用了患者的检测数据,提高了数据的利用效率。
27、上述任一技术方案中,所述步骤s4中,
28、利用患者i第0周至第24周的hbsag水平下降率数据,以初诊时刻0周为基线周,患者不同检测周的hbsag水平相对基线下降率的时间效应预测模型为:
29、
30、其中,wi,t为患者i拟预测的周数;为该患者的基线周数;为患者i参与预测的周数,即wi,t周之前患者i的最临近检测周数;为患者i在第周的hbsag水平相对基线的实际下降率;令表示预测的时间间隔周数;表示不同预测时间间隔的时间效应截距;x1,i表示性别,男性表示为1,女性表示为0;x2,i表示患者年龄,x3,i表示患者bmi值,表示患者i的基线hbsag水平,表示患者i的基线alt水平;x6,i表示患者i的基线hbeag水平,如果基线hbeag检测值大于1,则x6,i=1,表示为hbeag阳性,否则x6,i=0,表示为hbeag阴性;x7,i表示患者i的基线hbv dna水平,如果基线hbv dna检测值大于检测限,则x7,i=1,表示其为病毒血症,否则x7,i=0,表示为非病毒血症。
31、通过引入多种影响因素,如性别、年龄、bmi、基线hbsag水平、基线alt水平、基线hbeag水平和基线hbv dna水平等,使得时间效应预测模型能够为每个患者提供个性化的疾病下降率预测。时间效应预测模型中引入了时间效应,即不同预测时间间隔的时间效应截距,使得模型能够捕捉到疾病下降率随时间变化的趋势,提高了预测的准确性。
32、上述任一技术方案中,当拟预测的周数不超过24周时,即wi,t≤24,取基线周数直接利用时间效应预测模型预测hbsag水平相对基线的下降率;
33、时间效应截距的最大周数仅为24周,当拟预测的周数超过24周时,即wi,t>24,利用时间窗口滑动的方式对时间效应预测模型进行校正;除基线周外,时间效应预测模型构建时所用数据的时间窗口长度为24周,将时间窗口长度设置为24周;
34、当拟预测的周数wi,t>24时,保持时间窗口长度为24周并按步长1周从初诊时刻开始对该时间窗口进行滑动,直到滑动后的时间窗口刚好包含拟预测的周数wi,t;此时,对滑动后的时间窗口重新设立基线周,即以周为滑动后的时间窗口的基线周;由此,继续利用时间效应预测模型预测第wi,t周hbsag水平相对基线的下降率。
35、当拟预测的周数不超过24周时,可以直接利用时间效应预测模型预测hbsag水平相对基线的下降率,由于时间效应截距的最大周数仅为24周,因此这种方法对于短期内的疾病下降率预测具有较高的准确性,同时对于快速评估治疗效果和及时调整治疗方案非常有帮助。设置时间窗口长度为24周,可以充分利用现有数据,同时避免因时间跨度过长而导致的数据稀疏问题,提高时间效应预测模型的预测精度。当拟预测的周数超过24周时,采用时间窗口滑动思想对时间效预测模型进行校正,保持窗口长度为24周,确保预测模型的持续有效性,并在滑动时间窗口的过程中重新设立基线周,即以滑动后的时间窗口的基线周作为新的预测起点。这种动态调整预测基线的做法能够更好地反映疾病状态的实时变化,从而提高预测的准确性。
36、上述任一技术方案中,利用患者第0周至第24周的hbsag水平下降率数据,以初诊时刻0周为基线周,将时间效应预测模型和组轨迹模型进行耦合,构建了如下基于组轨迹模型的hbsag水平相对基线下降率的时间加组双效应预测模型:
37、
38、其中,wi,t为患者i拟预测的周数;为该患者的基线周数;为该患者参与预测的周数,即wi,t周之前该患者的最临近检测周数;为该患者在第个时刻周的hbsag相对基线的实际下降率;为预测的时间间隔周数;表示该患者在wi,t周时预测为第j潜在类别组时的时间效应截距,j=1,2,3;x1,i表示性别,男性表示为1,女性表示为0;x2,i表示患者年龄,x3,i表示患者bmi值,表示患者i的基线hbsag水平,表示患者i的基线alt水平;x6,i表示患者i的基线hbeag水平,如果基线hbeag检测值大于1,则x6,i=1,表示为hbeag阳性,否则x6,i=0,表示为hbeag阴性;x7,i表示患者i的基线hbv dna水平,如果基线hbv dna检测值大于检测限,则x7,i=1,表示为病毒血症,否则x7,i=0,表示为非病毒血症。
39、通过将时间效应预测模型和组轨迹模型进行耦合,同时考虑时间因素和患者群体的异质性,以此提高未来hbsag水平下降率预测精度。利用患者0-24周的hbsag水平下降率数据,能够根据患者的最新检测结果动态更新预测,使预测结果更加贴近患者的实际状况。通过引入潜在类别组的概念,能够识别出具有相似疾病下降趋势的患者群体,有助于医生对不同患者群体采取更为针对性的治疗策略。
40、上述任一技术方案中,所述步骤s5中,
41、当拟预测的周数不超过24周时,有以下步骤:
42、s51、确定基线周数,选择初始诊疗或研究的起始周作为基线周;
43、s52、基于基线周的数据和时间效应预测模型,直接预测未来不超过24周的hbsag水平相对基线的下降率。
44、通过确定基线周数并选择初始诊疗或研究的起始周作为基线,可以更准确地捕捉疾病发展的初始状态,为后续的预测提供更可靠的起点。当拟预测的周数不超过24周时,直接基于基线周的数据和时间效应预测模型进行预测,避免了复杂的数据处理和模型调整,提高了预测的效率。使得该方法适用于短期内的疾病下降率预测,对于需要快速了解疾病发展趋势的临床决策或研究具有重要意义。
45、上述任一技术方案中,所述步骤s5中,
46、当拟预测的周数超过24周时,有以下步骤:
47、s53、采用时间窗口滑动的方式对时间效应预测模型进行校正;
48、s54、设定时间窗口长度,除基线周外,构建时间效应预测模型时所用的数据时间窗口长度为24;
49、s55、拟预测时,保持时间窗口长度为24周,并按步长1周从初诊时刻开始滑动该时间窗口,随着时间推移,时间窗口会包含拟预测的周数;
50、s56、重新设立基线周,每次滑动时间窗口后,以滑动后的时间窗口的起始周作为新的基线周;
51、s57、基于滑动后时间窗口的数据和已建立的时间效应预测模型,预测未来的hbsag水平相对基线的下降率。
52、当预测周期超过24周时,采用时间窗口滑动的方式对时间效应预测模型进行校正,这种方法允许时间效应预测模型根据时间的推移动态调整,以更好地适应长期预测的需要,从而提高预测模型的准确性和实用性。通过滑动时间窗口,该方法能够随着时间推移包含拟预测的周数,从而实现对长时间段的预测,使得该方法能够适应不同长度的预测需求,具有更广泛的应用范围。每次滑动时间窗口后,重新设立基线周,以滑动后的时间窗口的起始周作为的基线周,灵活的基线调整方式,使得时间效应预测模型能够适应不同时间段的数据变化,进一步提高预测的准确性。该方法基于滑动后时间窗口的数据和已建立的时间效应预测模型,以预测未来hbsag水平相对基线的下降率,这种基于实时数据的预测方式,能够更快速地得到预测结果,提高工作效率。
53、上述任一技术方案中,所述步骤s1中,所述基本信息包括性别、年龄和bmi,所述时序检测数据包括检测日期、hbsag水平、hbeag水平、alt水平和hbv dna水平。
54、通过考虑患者的性别、年龄、bmi等多种因素,能够为每个患者提供个性化的疾病下降率预测,有助于医生制定更加个性化的治疗方案。通过时序检测数据的收集,实时监测患者的病情变化,及时发现病情恶化或改善的迹象,并提高预测精度,为医生提供及时的反馈信息,以便调整治疗方案。
1.一种通过混合效应模型预测疾病下降率的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s2中,下降率由下式计算:
3.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s3中,所述异质性潜在类别组包括快速高清除组、延时高清除组和缓慢低清除组。
4.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s3中,
5.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s4中,
6.根据权利要求5所述的通过混合效应模型预测疾病下降率的方法,其特征在于,
7.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,
8.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s5中,
9.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s5中,
10.根据权利要求1所述的通过混合效应模型预测疾病下降率的方法,其特征在于,所述步骤s1中,所述基本信息包括性别、年龄和bmi,所述时序检测数据包括检测日期、hbsag水平、hbeag水平、alt水平和hbv dna水平。