(一) 我们要解决的问题是什么?
Expression for Building Time Series Forecasting Problem
在建筑运行领域,时间序列预测有着广泛的应用。传统方法常依赖于针对不同场景训练单独的机器学习模型,这些数据驱动的方式往往受限于数据可用性,尤其在不同项目间无法共享数据。此外,常规机器学习模型对物理机理和常识的理解不足。因此,我们需要一种更通用的方法,不仅能认知物理机制,还能够实现实际项目的“零启动” ,即无需大量初始数据便能提供合理预测 。这个方法需充分整合各种数据来源,包括时间序列、静态信息和图数据,以弥补单一数据类型的不足。
(二)BOSG 和 LLM时间是什么区别?
Building Operation Simulation Generator
BOSG(Building Operation Simulation Generator)是针对建筑运行领域的大模型,与LLM(Large Language Model)在逻辑结构上有相似之处。BOSG从Prompt、Token、Embedding、Inference到Output都可一一对应。BOSG的Prompt不仅包含具体预测问题,还将一个项目的物理世界作为上下文。Token是最小语义单元,在我们的场景里是对象实例在某个时间切片的状态。Embedding则为对象实例的编码向量,融合了图关系与时序信息。推理Inference和输出Output是生成对未来多变量长期预测的过程和结果。
(三)我们的大模型算法框架是什么?
Heterogeneous Graph Temporal Fusion Transformer
BOSG采用的核心算法框架为Heterogeneous Graph Temporal Fusion Transformer HGTFT。HGTFT的设计包括三部分:首先是节点编码,将每个Token转化为固定维度的编码向量,类似于语言模型中的最小语义单元编码。其次是图关系编码,将对象间的拓扑关系聚合到每个实例的编码中。最后是时间编码,通过多层Transformer网络捕捉时间序列中的依赖关系,并将其聚合到对象的表示中。整体算法框架使模型在应对建筑复杂动态场景时,能够有效结合时序与结构信息。
(四)这么复杂的模型该如何训练和应用? Model Training Procedure
为了充分发挥这种复杂模型的性能,我们设计了一系列自监督和监督学习任务 。每项任务都配备了专门的损失函数和微调策略。编码器部分先在大型数据集上进行预训练,而HGTFT的核心参数在随后的任务中保持固定,仅对特定任务的网络部分进行微调。该架构支持在实际项目中实现“zero-shot”预测,即无需大量训练便能给出合理结果,并且可以通过少量样本的微调进一步提升精度。这一流程确保模型不仅具备高预测能力,还能快速适应不同业务需求 。
(五)如何验证大模型的表现? Results
我们通过与其他算法进行横向比较,验证了BOSG模型在预测准确性上的显著提升。此外,还采用了一系列合理性评价标准,评估模型对物理机理和常识的理解程度。这些评估过程确保模型不仅在数据维度上表现优异,还能反映建筑系统的运行逻辑。结果表明,BOSG能够有效应对建筑领域的复杂场景,实现高效、可靠的预测与分析 。
(六)什么业务会用到BOSG?
Building Operation Optimization Based on BOSG
BOSG大模型能够推动建筑运行相关业务的重新设计与实施,为现有业务的能力和发展路径带来跨越式提升。具体应用场景包括:运行控制策略推送、运行后评估分析、故障诊断与风险评估、数据质量检查与补全、数字化交付信息缺失填补、能耗总支路间的关系预测等。基于BOSG的能力,各类业务不仅可以提高现有流程的效率,还为未来建筑管理和运行提供更智能的解决方案。
BOSG的诞生,将建筑领域的时序预测能力提升到前所未有的高度,带来更高效、更智能、更绿色的建筑管理解决方案。这不仅是一项技术革新,更是一次产业变革!建筑领域真正迈入大模型时代!
团队其他核心成员:
孙一凫,沈启,李昕,赵元凯,龚启鹏,邱英秋