本发明涉及图谱处理,具体涉及一种虚拟图谱的生成方法与电子设备。
背景技术:
1、生物技术药物是指采用dna重组技术或其他创新生物技术生产的治疗药物,涵盖了重组蛋白/重组多肽、疫苗、核酸药物、细胞治疗产品等,是单抗药物的重要研究对象。
2、目前,已有图谱识别大模型可基于药物的拉曼光谱来进行药品识别,但随着谱库的不断扩大,需要新的模型适应更多类别的药品识别。传统的图谱识别技术通常需要大量的人工标注数据才能进行训练,想要保证新模型的准确性,则依赖于海量的生物技术药物的拉曼光谱数据作为训练数据,但是生物技术药物拉曼光谱的采集依赖于样品、仪器和时间,采集海量拉曼光谱数据再人工标注用于模型训练极为困难且成本高昂。
技术实现思路
1、本发明的目的是提供了一种虚拟图谱的生成方法与电子设备,对目标物的原始实测图谱的原始纵轴数组进行符合拉曼光谱特性的处理,由此所得到的目标物的虚拟图谱也同样能够符合拉曼光谱特性,其中采用原始横轴数组与所述新纵轴数组进行组合,也能保证所得到的虚拟图谱具有原始实测图谱的特征信息;由上可使所生成的虚拟图谱即保留了原始的特征信息又符合拉曼光谱特性,保证了所生成的虚拟图谱的可靠性,从而可以大量生成虚拟图谱来作下一步的使用,比如用作图谱识别模型训练的训练数据。
2、为实现上述目的,本发明提供了一种虚拟图谱的生成方法,包括:获取目标物的原始实测图谱的原始横轴数组与原始纵轴数组,所述原始实测图谱为拉曼光谱图;在所述原始纵轴数组中的预设位置处增加设定数量的强度值,并在原始纵轴数组中对应于所述预设位置的另一位置处删除所述设定数量的强度值,得到第一纵轴数组;针对所述第一纵轴数组中的每个指定强度值,计算所述指定强度值与强度变化百分比之间的乘积,并在所述第一纵轴数组中,利用各所述指定强度值对应的乘积更新所述指定强度值,得到第二纵轴数组;从所述第二纵轴数组中选取连续预设数量的选定强度值,在所述连续预设数量的选定强度值中确定一个极大值作为目标强度值,并基于所述目标强度值确定正弦波波幅范围,在所述正弦波波幅范围内进行采样生成正弦波数组;在所述正弦波数组中选取连续预设数量的正弦波幅值,并基于所述连续预设数量的正弦波幅值对所述第二纵轴数组中连续预设数量的选定强度值进行调整,得到新纵轴数组;将所述原始横轴数组与所述新纵轴数组进行组合,得到所述目标物的虚拟图谱。
3、本发明还提供了一种电子设备,包括:一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有计算机程序,所述计算机程序由所述一个或多个处理器加载并执行以实现如上述的虚拟图谱的生成方法。
4、在一个实施例中,在所述原始纵轴数组中的预设位置处增加设定数量的强度值,并在原始纵轴数组中对应于所述预设位置的另一位置处删除所述设定数量的强度值,包括:
5、在所述原始纵轴数组中第一位强度值之前增加设定数量的强度值,并在所述原始纵轴数组中最后一位强度值开始向前删除所述设定数量的强度值;或者,
6、在所述原始纵轴数组中最后一位强度值之后增加设定数量的强度值,并在所述原始纵轴数组中第一位强度值开始向后删除所述设定数量的强度值。
7、在一个实施例中,在所述连续预设数量的选定强度值中确定一个极大值作为目标强度值,包括:
8、确定所述连续预设数量的选定强度值中的全部极大值点;
9、在所述全部极大值点中去除第一个极大值点后,选取出最大的极大值点对应的强度值作为所述目标强度值。
10、在一个实施例中,所述基于所述连续预设数量的正弦波幅值对所述第二纵轴数组中连续预设数量的选定强度值进行调整,得到新纵轴数组,包括:
11、对所述连续预设数量的正弦波幅值进行倒序排列;
12、将倒序排列后的所述连续预设数量的正弦波幅值与所述第二纵轴数组中连续预设数量的选定强度值分别对应相加,得到新纵轴数组。
13、在一个实施例中,在所述正弦波波幅范围内进行采样生成正弦波数组,包括:
14、按照设定的采样频率与正弦波频率,在所述正弦波波幅范围进行采样得到正弦波数组。
15、在一个实施例中,所述强度变化百分比位于0.995至1.005之间。
16、在一个实施例中,所述设定数量为在1至5中随机选取的值。
17、在一个实施例中,所述正弦波波幅范围的获取方式为:将目标强度值乘以上限百分比值得到正弦波波幅范围的波幅上限值、将目标强度值乘以下限百分比值得到正弦波波幅范围的波幅下限值,上限百分比值为0.3,下限百分比值为0.03。
18、在一个实施例中,从所述第二纵轴数组中选取连续预设数量的选定强度值为所述第二纵轴数组中的前n个强度值,从所述正弦波数组中选取连续预设数量的正弦波幅值为所述正弦波数组的前n个正弦波幅值,n为1800。
1.一种虚拟图谱的生成方法,其特征在于,包括:
2.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,
3.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,在所述连续预设数量的选定强度值中确定一个极大值作为目标强度值,包括:
4.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,所述基于所述连续预设数量的正弦波幅值对所述第二纵轴数组中连续预设数量的选定强度值进行调整,得到新纵轴数组,包括:
5.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,在所述正弦波波幅范围内进行采样生成正弦波数组,包括:
6.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,所述强度变化百分比位于0.995至1.005之间。
7.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,所述设定数量为在1至5中随机选取的值。
8.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,所述正弦波波幅范围的获取方式为:将目标强度值乘以上限百分比值得到正弦波波幅范围的波幅上限值、将目标强度值乘以下限百分比值得到正弦波波幅范围的波幅下限值,上限百分比值为0.3,下限百分比值为0.03。
9.根据权利要求1所述的虚拟图谱的生成方法,其特征在于,从所述第二纵轴数组中选取连续预设数量的选定强度值为所述第二纵轴数组中的前n个强度值,从所述正弦波数组中选取连续预设数量的正弦波幅值为所述正弦波数组的前n个正弦波幅值,n为1800。
10.一种电子设备,其特征在于,包括:一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有计算机程序,所述计算机程序由所述一个或多个处理器加载并执行以实现如权利要求1-9任一项所述的虚拟图谱的生成方法。