本发明涉及脉冲星候选识别,尤其是一种用于处理数据漂移问题的增量学习模型,适用于天文观测数据的智能处理与分析,特别是涉及一种用于动态脉冲星数据分析的增量学习方法和系统。
背景技术:
1、随着天文观测技术的快速发展以及数据采集能力的显著提升,科学家们已能获取大量的天文数据,特别是在脉冲星观测领域。脉冲星是高度压缩的中子星,具有极端的物理性质和规律的脉冲发射特征,是天文物理研究中的重要对象。传统的脉冲星识别方法主要依赖于预先定义的阈值和人工选取的特征,这些方法往往在大数据环境下效率低下,且容易受到数据质量和数据量变化的影响。具体来说,随着时间的推移,由于观测设备的更换和升级、观测环境的变化以及观测策略的调整,收集到的数据性质和分布可能会发生显著变化,即所谓的“数据漂移”。数据漂移问题对脉冲星的自动识别系统构成了极大挑战,因为传统的机器学习模型通常假设训练数据和未来数据保持同一分布,这一假设在天文观测数据中往往不成立。此外,不同的天文望远镜和观测设备因技术和设计差异,可能导致数据间存在系统误差,这些差异未经适当处理会影响模型的泛化能力和识别准确性。同时,脉冲星数据本身的不均匀性和稀疏性也增加了识别工作的复杂度。
2、现有技术中尝试通过各种统计方法和机器学习技术来解决这些问题,例如使用支持向量机、随机森林等传统算法以及resnet、cnn等深度学习算法进行分类识别。然而,这些方法在实际应用中仍难以处理大规模数据集,特别是在数据分布发生显著变化时的适应性问题。因此,急需开发新的技术方案,以提高脉冲星识别技术在动态和大数据环境下的准确性和效率,特别是能够自适应地处理数据漂移和设备差异问题,从而在天文数据分析领域实现突破性的进展。本发明就是在此背景下提出,旨在通过引入增量学习和贝叶斯神经网络技术,解决上述问题,提升脉冲星候选体的识别性能。
技术实现思路
1、本发明提出了一种用于动态脉冲星数据分析的增量学习方法和系统。旨在动态调整学习模型以适应新的数据分布,有效处理数据漂移问题,提高脉冲星候选体识别的准确性和效率。
2、本发明是通过以下技术方案实现的,本发明提出一种用于动态脉冲星数据分析的增量学习方法,所述方法包括:
3、s1:分析脉冲星数据集,确定存在数据漂移问题;
4、s2:采用权重调整技术,处理因非脉冲星候选数据过多而导致的潜在数据不平衡问题;
5、s3:将模型中的神经网络替换为贝叶斯神经网络,捕捉数据的不确定性并增强模型的鲁棒性;
6、s4:设计增量学习模型,允许增量学习模型在接收新数据时动态调整,通过后验分布更新来适应新数据集,而不需从头开始训练;
7、s5:增量学习模型采用多模态结构,以贝叶斯神经网络为基础,并结合自适应重放机制融入当前任务的增量学习模型训练中,使增量学习模型能够利用先前任务的知识,增强处理新任务时的准确性和稳定性。
8、进一步地,所述s1中,观察脉冲星候选数据的最佳周期、信噪比和最佳dm值随时间的变化趋势,确定数据存在漂移问题,另外还需观测环境的变化、观测策略的调整,以及星际介质的动态变化引起数据的漂移问题。
9、进一步地,所述s2中,引入focal损失函数,动态调整易分类样本的损失权重,减轻了不平衡数据对增量学习模型训练的负面影响。
10、进一步地,所述s3中,增量学习模型均采用贝叶斯神经网络,并对每层网络进行kl散度计算以捕捉数据的不确定性并增强模型的鲁棒性;为了进行贝叶斯推断,使用证据下界近似作为目标函数:
11、f(d,θ)=dkl(q(w|θ)||p(w))-eq(w|θ)[log p(d|w)] (1)。
12、进一步地,所述s4中,通过迭代更新后验分布,网络逐步吸收新数据而不遗忘旧数据;当新的数据到达时,使用当前的后验分布作为新的先验分布,并通过贝叶斯推断来更新参数的后验分布,实现增量学习模型的动态更新;动态更新公式表达为:
13、p(w|dnew,dold)∝p(dnew|w)p(w|dold) (2)。
14、进一步地,所述s5中,多模态增量学习模型以贝叶斯神经网络为基础,采用贝叶斯一维卷积神经网络、贝叶斯二维卷积神经网络相结合的方式进行建模,并采用贝叶斯线性网络做进一步处理,生成最终的输出。
15、进一步地,所述贝叶斯二维卷积神经网络用来提取局部特征,并通过包含批归一化层、激活函数、自适应平均池化层以及线性层和sigmoid激活的seblock残差模块,实现多次特征增强和提取;注意力机制帮助增量学习模型更有效地聚焦于重要的特征区域,从而提升数据表示的质量。
16、本发明提出一种用于动态脉冲星数据分析的增量学习系统,所述系统包括:
17、分析模块:分析脉冲星数据集,确定存在数据漂移问题;
18、调整模块:采用权重调整技术,处理因非脉冲星候选数据过多而导致的潜在数据不平衡问题;
19、替换模块:将模型中的神经网络替换为贝叶斯神经网络,捕捉数据的不确定性并增强模型的鲁棒性;
20、设计模块:设计增量学习模型,允许增量学习模型在接收新数据时动态调整,通过后验分布更新来适应新数据集,而不需从头开始训练;
21、处理模块:增量学习模型采用多模态结构,以贝叶斯神经网络为基础,并结合自适应重放机制融入当前任务的增量学习模型训练中,使增量学习模型能够利用先前任务的知识,增强处理新任务时的准确性和稳定性。
22、本发明还提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种用于动态脉冲星数据分析的增量学习方法的步骤。
23、本发明还提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种用于动态脉冲星数据分析的增量学习方法的步骤。
24、本发明的有益效果:
25、本发明通过引入增量学习和贝叶斯神经网络技术,能够有效适应数据漂移和不同观测设备间的系统误差,从而显著提高脉冲星识别的准确性。这种自适应学习模式确保了模型可以在数据特性逐渐变化的环境中持续学习和优化。同时,由于增量学习框架的引入,本发明能够不断地从新数据中学习,不需要从头开始重新训练模型。这使得模型可以更好地适应快速变化的天文观测数据,特别是在长期的天文研究项目中非常有益。
1.一种用于动态脉冲星数据分析的增量学习方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述s1中,观察脉冲星候选数据的最佳周期、信噪比和最佳dm值随时间的变化趋势,确定数据存在漂移问题,另外还需观测环境的变化、观测策略的调整,以及星际介质的动态变化引起数据的漂移问题。
3.根据权利要求1所述的方法,其特征在于,所述s2中,引入focal损失函数,动态调整易分类样本的损失权重,减轻了不平衡数据对增量学习模型训练的负面影响。
4.根据权利要求1所述的方法,其特征在于,所述s3中,增量学习模型均采用贝叶斯神经网络,并对每层网络进行kl散度计算以捕捉数据的不确定性并增强模型的鲁棒性;为了进行贝叶斯推断,使用证据下界近似作为目标函数:
5.根据权利要求1所述的方法,其特征在于,所述s4中,通过迭代更新后验分布,网络逐步吸收新数据而不遗忘旧数据;当新的数据到达时,使用当前的后验分布作为新的先验分布,并通过贝叶斯推断来更新参数的后验分布,实现增量学习模型的动态更新;动态更新公式表达为:
6.根据权利要求1所述的方法,其特征在于,所述s5中,多模态增量学习模型以贝叶斯神经网络为基础,采用贝叶斯一维卷积神经网络、贝叶斯二维卷积神经网络相结合的方式进行建模,并采用贝叶斯线性网络做进一步处理,生成最终的输出。
7.根据权利要求6所述的方法,其特征在于,所述贝叶斯二维卷积神经网络用来提取局部特征,并通过包含批归一化层、激活函数、自适应平均池化层以及线性层和sigmoid激活的seblock残差模块,实现多次特征增强和提取;注意力机制帮助增量学习模型更有效地聚焦于重要的特征区域,从而提升数据表示的质量。
8.一种用于动态脉冲星数据分析的增量学习系统,其特征在于,所述系统包括:
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-7任一项所述方法的步骤。
