本发明涉及能源管理与节能优化领域,具体涉及智能建筑管理系统、物联网、边缘计算及人工智能应用技术,尤其是基于多模态数据处理和强化学习算法的建筑能耗监测与优化方法。
背景技术:
1、随着全球能源需求的不断增长和环境保护意识的提高,能源管理和节能减排已经成为世界各国的重点关注领域。建筑能耗在总能源消耗中占有很大比例,特别是在城市区域,建筑能耗的高效管理对于实现可持续发展至关重要。然而,现有的建筑能耗管理系统在应对复杂环境和多变的用户需求时,仍面临诸多挑战。
2、传统的建筑能耗管理系统通常依赖于单一或少量的数据源,如温度、湿度等环境参数。这些系统多采用静态规则或基于经验的简单模型进行能耗预测和设备控制,缺乏实时响应和动态优化能力,导致能耗管理效果不理想。此外,这些方法难以处理建筑内部多模态数据之间的复杂关系,无法全面反映环境变化和用户行为对能耗的影响。
3、随着物联网(iot)技术的发展,多模态传感器网络在建筑中的应用越来越普遍。这些传感器能够实时采集包括温度、湿度、光照强度、co2浓度和人员活动在内的多种环境数据和用户行为数据。然而,如何高效地融合和利用这些多模态数据,仍然是一个亟待解决的技术难题。
4、另一方面,深度学习和强化学习等人工智能技术在各个领域取得了显著进展。特别是transformer模型在自然语言处理和计算机视觉等任务中表现出色,其强大的特征提取和数据融合能力为解决多模态数据处理问题提供了新的思路。此外,多智能体强化学习通过多个智能体的协同工作,实现了复杂系统的优化控制,展示出在动态环境中进行实时决策和优化的潜力。
5、尽管已有研究尝试将这些先进技术应用于建筑能耗管理,但在实际应用中仍存在模型复杂度高、计算资源需求大、实时性和适应性不足等问题。传统深度学习模型在处理大规模多模态数据时,计算成本高、部署困难,难以在资源受限的边缘设备上高效运行。因此,如何设计一种能够高效处理多模态数据、实现精确能耗预测和优化控制,同时适应复杂动态环境的智能建筑能耗管理系统,成为当前研究的热点和难点。
技术实现思路
1、针对现有技术的缺陷,本发明提供一种种基于大模型与多智能体的能耗监测与优化方法、系统,通过多模态数据融合、精确能耗预测、智能优化控制,实现对建筑内部空调、照明等能耗设备的高效管理,提高建筑能效,降低能源消耗,解决现有技术中的诸多不足。
2、为了解决所述技术问题,本发明采用的技术方案是:一种基于大模型与多智能体的能耗监测与优化方法,包括以下步骤:
3、s01)、部署多模态传感器,多模态传感器实时采集建筑内部环境数据和用户行为数据;
4、s02)、多模态传感器采集的数据传输至中央数据处理中心,中央数据处理中心对接收的数据进行预处理,预处理包括清洗、标准化和特征提取;
5、s03)、多模态传感器采集的原始数据以及预处理提取的特征输入数据融合模块,数据融合模块采用transformer模型进行多模态数据融合,通过多层注意力机制,捕捉不同数据源中的重要特征,从而生成高维特征向量;
6、s04)、融合的特征向量输入混合神经网络模型,混合神经网络模型包括积神经网络cnn和长短时记忆网络lstm,卷积神经网络cnn用于提取空间特征,识别各区域的环境特征,长短时记忆网络lstm用于捕捉时间序列特征,识别能耗的时序变化规律,实现能耗预测。
7、进一步的,数据融合模块进行多模态数据融合的过程为:
8、s31)、获取多模态传感器采集的原始数据以及预处理提取的特征,将这些数据转换为适合transformer模型的格式,即将每种传感器的数据以及预处理提取的特征按照时间戳对齐,形成一个时间序列矩阵,时间序列矩阵的每行表示某个特定时间戳下对应的多个传感器数据和预处理提取的特征,时间序列矩阵的每列表示一个传感器的数据类型或预处理提取的特征;
9、s32)、构建transformer模型,根据建筑能耗场景,确定transformer模型编码器的层数、注意力机制的头数和隐藏层的维度;
10、s33)、基于构建的transformer模型进行多模态数据融合,生成高维特征向量。
11、进一步的,混合神经网络模型进行能耗预测的过程为:
12、s41)、数据融合模块输出的高维特征向量形状为[(批次大小, 时间步数, 高维特征数)],这些特征向量已经通过transformer模型融合了多模态数据的空间和时间相关性,将这些高维特征向量输入到卷积神经网络层,卷积神经网络层进一步提取和压缩高维特征向量的空间特征,具体为:
13、a)、应用多个一维卷积核进行卷积操作,每个卷积核在时间步数维度上滑动,捕捉不同时间步内的局部特征,卷积操作后的输出形状为[(批次大小, 时间步数, 卷积输出通道数)];
14、b)、池化层对卷积层的输出进行降维操作,池化层在时间步数维度上进行操作,减少特征图的维度并保留主要特征,池化后的输出形状为[(批次大小, 时间步数, 降维后的通道数)];
15、s42)、将池化后的特征图输入到长短时记忆网络lstm,长短时记忆网络lstm捕捉特征图在时间步数维度上的长期依赖关系和动态变化,lstm的输出是每个时间步的隐藏状态,形状为[(批次大小, lstm单元数)];
16、s43)、长短时记忆网络lstm的输出接入全连接层,全连接层通过线性变换和非线性激活函数对特征进行深层次的组合和变换,最终生成能耗预测值;对于回归任务,输出层采用线性激活函数,生成连续的能耗值;对于分类任务,采用softmax激活函数,输出能耗状态的分类概率。
17、进一步的,还包括步骤s05)、能耗优化,基于能耗预测结果设计多智能体强化学习系统优化能耗设备的运行参数,每个智能体负责特定区域或类型的能耗设备,智能体根据实时数据动态调整设备的运行参数,并通过共享经验和策略,实现全局最优控制;每个智能体的状态由能耗预测值和环境参数构成,动作包括调整设备的运行参数,为了平衡能耗优化和用户舒适度,奖励函数设计为:,其中α和β为权重参数,即以能耗减少或用户舒适度提升为奖励信号来调整智能体优化能耗设备的行为;
18、所述能耗为混合神经网络输出的能耗预测结果,不舒适度通过比较建筑内实际环境参数与既定的舒适阈值偏差来计算,不同参数的不舒适度单独计算,然后通过加权平均的方式形成一个综合不舒适度指数,奖励函数公式中引用综合不舒适度指数;
19、各智能体采用分布式深度强化学习算法,通过经验回放和全局策略更新提升学习效率和效果,经验回放是每个智能体将其交互经验存储在经验回放池中,定期采样用于训练,全局策略是策略网络和价值网络通过梯度下降方法进行更新;各智能体间通过共享信息和策略协同工作。
20、进一步的,本方法还包括步骤s06)、自适应剪枝,通过自适应剪枝实现对数据融合模块、混合神经网络模型的优化,自适应剪枝智能识别并移除模型中的冗余参数,考虑不同层对任务的贡献,自动调整每层的具体剪枝率。
21、进一步的,本方法还包括步骤s07)、持续学习,持续学习通过在线学习和迁移学习实现自适应持续学习,在线学习是模型在接收到新的传感器数据时即时更新,迁移学习是通过使用先前学习到的知识来加速新任务的学习过程;
22、持续学习模块同时引入弹性权重整合和经验回放,弹性权重整合是在训练新任务时对重要参数施加正则化,保持旧任务的重要特征不被遗忘,经验回放是将历史数据与新数据混合使用,定期从经验回放池中采样,进行训练和调节,以确保模型的稳定性和持续性能;
23、上述模型指transformer模型和混合神经网络,通过持续学习使transformer模型和混合神经网络适应随时间变化的环境和不断演进的用户需求。
24、进一步的,步骤s02)中的特征提取包括统计特征提取、频域分析、维度简约,统计特征提取通过计算时间序列数据的滑动窗口统计量,频域分析利用快速傅里叶变换fft提取能耗数据的主要频率成分,维度简约用于从复杂的数据集中提取设定的主要成分。
25、进一步的,多模态传感器包括温度传感器、湿度传感器、光照强度传感器、co2浓度传感器和人体红外传感器。
26、本发明还公开一种基于大模型与多智能体的能耗监测系统,包括:
27、数据采集层,数据采集层包括多模态传感器和传感器管理模块,多模态传感器实时采集建筑内部环境数据和用户行为数据,传感器管理模块用于监控传感器的状态、管理数据的实时传输;
28、数据处理和融合层,数据处理和融合层包括数据预处理模块、数据存储模块和数据融合模块,数据预处理模块接收多模块传感器采集的数据并进行包括清洗、标准化和特征提取在内的预处理,数据存储模块对多模态传感器采集的原始数据以及预处理提取的特征进行存储,数据融合模块是采用采用transformer模型对多模态传感器采集的原始数据以及预处理提取的特征进行融合,通过多层注意力机制,捕捉不同数据源中的重要特征,从而生成高维特征向量,数据融合过程为:获取多模态传感器采集的原始数据以及预处理提取的特征,将这些数据转换为适合transformer模型的格式,即将每种传感器的数据按照时间戳对齐,形成一个时间序列矩阵,时间序列矩阵的每行表示某个特定时间戳下对应的多个传感器数据和预处理提取的特征,时间序列矩阵的每列表示一个传感器的数据类型或预处理提取的特征;构建transformer模型,根据建筑能耗场景,确定transformer模型编码器的层数、注意力机制的头数和隐藏层的维度;基于构建的transformer模型进行多模态数据融合,生成高维特征向量;
29、模型预测与优化层,模型预测与优化层包括能耗预测模块、强化学习模块和持续学习模块,能耗预测模块是在数据融合得到高维特征向量后,再将此向量通过能耗预测模块进行能耗预测,能耗预测模块采用混合神经网络,进行能耗预测的过程为:将高维特征向量输入到卷积神经网络层,卷积神经网络层进一步提取和压缩高维特征向量的空间特征,具体为:a)、应用多个一维卷积核进行卷积操作,每个卷积核在时间步数维度上滑动,捕捉不同时间步内的局部特征,卷积操作后的输出形状为[(批次大小, 时间步数, 卷积输出通道数)];b)、池化层对卷积层的输出进行降维操作,池化层在时间步数维度上进行操作,减少特征图的维度并保留主要特征,池化后的输出形状为[(批次大小, 时间步数, 降维后的通道数)];将池化后的特征图输入到长短时记忆网络lstm,长短时记忆网络lstm捕捉特征图在时间步数维度上的长期依赖关系和动态变化,lstm的输出是每个时间步的隐藏状态,形状为[(批次大小, lstm单元数)];长短时记忆网络lstm的输出接入全连接层,全连接层通过线性变换和非线性激活函数对特征进行深层次的组合和变换,最终生成能耗预测值;对于回归任务,输出层采用线性激活函数,生成连续的能耗值;对于分类任务,采用softmax激活函数,输出能耗状态的分类概率;
30、强化学习模块使用多智能体强化学习策略,经过混合神经网络训练后的能耗预测结果将作为多智能体强化学习优化的输入,以实现能耗管理和优化,每个智能体负责管理特定区域或类型的设备,智能体的状态由能耗预测值和环境参数构成,动作包括调整设备的运行参数,为了平衡能耗优化和用户舒适度,奖励函数设计为:,其中α和β为权重参数;即以能耗减少或用户舒适度提升为奖励信号来调整智能体优化能耗设备的行为;
31、所述能耗为混合神经网络输出的能耗预测结果,不舒适度通过比较建筑内实际环境参数与既定的舒适阈值偏差来计算,不同参数的不舒适度单独计算,然后通过加权平均的方式形成一个综合不舒适度指数,奖励函数公式中引用综合不舒适度指数;
32、各智能体采用分布式深度强化学习算法,通过经验回放和全局策略更新提升学习效率和效果,经验回放是每个智能体将其交互经验存储在经验回放池中,定期采样用于训练,全局策略是策略网络和价值网络通过梯度下降方法进行更新;各智能体间通过共享信息和策略协同工作;
33、持续学习模块通过在线学习和迁移学习实现自适应持续学习,在线学习是模型在接收到新的传感器数据时即时更新,迁移学习是通过使用先前学习到的知识来加速新任务的学习过程;持续学习模块同时引入弹性权重整合和经验回放,弹性权重整合是在训练新任务时对重要参数施加正则化,保持旧任务的重要特征不被遗忘,经验回放是将历史数据与新数据混合使用,定期从经验回放池中采样,进行训练和调节,以确保模型的稳定性和持续性能;上述模型指transformer模型和混合神经网络,通过持续学习使transformer模型和混合神经网络适应随时间变化的环境和不断演进的用户需求;
34、应用层,应用层包括实时反馈与调整模块、用户行为分析模块和系统监控与管理模块。
35、进一步的,数据融合模块还包括模型训练与评估调整,选择适合建筑能耗预测的损失函数和优化算法,对于回归任务中的能耗预测,采用均方误差损失函数,对于非回归任务的能耗场景采用交叉熵损失函数,优化算法选择adam优化器;
36、模型训练过程中,将预处理后的高维特征向量输入到transformer模型中,通过多轮迭代优化模型参数,每轮训练后,使用验证集数据评估模型的性能,计算损失函数评估指标,根据评估结果,调整模型超参数,超参数包括学习率、编码器层数和注意力头数。
37、本发明的有益效果:本发明通过集成传感器网络、大数据处理和深度学习技术,确保了从数据采集到应用实施的无缝对接。特别是通过应用混合神经网络和多智能体强化学习技术,本系统不仅优化了能源消耗,还提升了环境舒适度和系统响应速度。此外,持续学习模块的引入使得系统能够适应不断变化的环境条件,保证了长期运行的效率和稳定性。
1.一种基于大模型与多智能体的能耗监测与优化方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:数据融合模块进行多模态数据融合的过程为:
3.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:混合神经网络模型进行能耗预测的过程为:
4.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:还包括步骤s05)、能耗优化,基于能耗预测结果设计多智能体强化学习系统优化能耗设备的运行参数,每个智能体负责特定区域或类型的能耗设备,智能体根据实时数据动态调整设备的运行参数,并通过共享经验和策略,实现全局最优控制;每个智能体的状态由能耗预测值和环境参数构成,动作包括调整设备的运行参数,为了平衡能耗优化和用户舒适度,奖励函数设计为: ,其中α和β为权重参数,即以能耗减少或用户舒适度提升为奖励信号来调整智能体优化能耗设备的行为;
5.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:本方法还包括步骤s05)、自适应剪枝,通过自适应剪枝实现对数据融合模块、混合神经网络模型的优化,自适应剪枝智能识别并移除模型中的冗余参数,考虑不同层对任务的贡献,自动调整每层的具体剪枝率。
6.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:本方法还包括步骤s07)、持续学习,持续学习通过在线学习和迁移学习实现自适应持续学习,在线学习是模型在接收到新的传感器数据时即时更新,迁移学习是通过使用先前学习到的知识来加速新任务的学习过程;
7.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:步骤s02)中的特征提取包括统计特征提取、频域分析、维度简约,统计特征提取通过计算时间序列数据的滑动窗口统计量,频域分析利用快速傅里叶变换fft提取能耗数据的主要频率成分,维度简约用于从复杂的数据集中提取设定的主要成分。
8.根据权利要求1所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:多模态传感器包括温度传感器、湿度传感器、光照强度传感器、co2浓度传感器和人体红外传感器。
9.一种基于大模型与多智能体的能耗监测系统,其特征在于:包括:
10.根据权利要求9所述的基于大模型与多智能体的能耗监测与优化方法,其特征在于:数据融合模块还包括模型训练与评估调整,选择适合建筑能耗预测的损失函数和优化算法,对于回归任务中的能耗预测,采用均方误差损失函数,对于非回归任务的能耗场景采用交叉熵损失函数,优化算法选择adam优化器;