摘要:围绕数字孪生技术,提出一种数据中心全生命周期(包括设计、建设和运维阶段)数字孪生的解决方案,提升行业智能化水平,助力节能降碳。首先介绍了数据中心数字化智能化的现状和问题,其次说明了解决方案的体系架构和五大关键技术,最后,对数据中心数字孪生关键技术及体系架构进行总结与展望。
数据中心作为数字基础设施和人工智能的基石,已成为智慧时代最主要的算力生产中心和供应中心。全社会对算力的需求仍将以每年20%的速度增长。近日,国家发改委启动“东数西算”枢纽节点建设工程,在双碳目标引领下,数据中心建设正在从粗放的高速发展阶段向有序可控的绿色低碳高质量发展阶段转变。数据中心系统复杂,设备繁多,投资巨大,设计建造和运维难度都比较大,数字孪生技术的出现为这一复杂工程的优化提供了新的方向。数字孪生概念最早用于航空航天飞行器的健康维护与保障。近几年涌现了一大批相关研究与应用,从其应用来看,数字孪生在整合企业的制造流程,实现产品从设计到维护全过程的数字化,生产可视化,形成从分析到控制再到分析的闭合回路,在优化整个生产系统方面可以起到积极的作用。
当前数据中心全产业链在设计、建造、运行和改造等环节仍然大多处于粗放状态。数字化智能化程度低于其他行业,其根本原因在于,一方面由于数据中心往往具有体量大、拓扑复杂和多物理场耦合等特征,问题本身十分复杂难度较高;另一方面,由于涉及工程热物理、暖通空调、自动控制等多个学科专业交叉,少有人可以精通以上专业并将其融会贯通,进而导致各个专业和各个环节各自为政。数据中心的数字化管理从早期的动环监控系统,发展到DCIM综合管理系统,进而到目前的智慧运营系统,其数字化智能化水平也在不断地深入提高。但是目前仍存在以下问题。
a) 目前大部分应用还处于信息化数字化阶段,主要起到增强“可看”的展示作用,尚不能达到“可控”的水平。
b) 数据中心系统复杂,业务逐步加载,工况多变,目前的大部分系统运行期间无法实时感知机房内部的变化,且由于运维人员职业素养参差不齐,无法及时维护平台的数据,使其与机房实际情况无法保持一致,长此以往导致运维数据失真。
c) 大量的数据中心BIM模型还停留在静态模型层面,以解决设计和建造阶段的若干痛点为目的,未涉及数据中心运营阶段的痛点和需求,模型数据尚未实现完整的转移到运维阶段,造成数据资源的浪费。
近年来在数据中心的运行中,基于反向传播神经网络、支持向量机、决策树、专家系统、知识推理等技术在设备功率预测、机房温度控制、资源与能耗协同调度等方面已实现了初步应用。随着当前以深度学习、强化学习、知识图谱和类脑科学为代表的新一代人工智能技术的迅速发展,如果能够在计算机数字世界里面建立和实际数据中心无明显差别的虚拟体,将能够发挥计算机人工智能计算优势解决复杂度问题,并在数字空间打通专业间的隔阂达到真正的高效协同,大幅度提高生产效率和数据中心运行能源效率。
基于此,本文提出一种数据中心机房设计运行全过程数字孪生技术方法。该技术充分利用数据中心物理模型、传感器测量和运行数据,集成多学科、多物理量、多尺度、多概率仿真,研究数据中心机房空间、电力、空调等基础设施全生命周期数据重构与孪生体系;研究其各类空间和设备等物理实体与性能状态的映射关系、数据挖掘及仿真模拟融合技术,以及故障诊断、趋势预测和控制反馈技术,通过对虚拟孪生体实时性能状态的仿真和分析发现解决实际数据中心运营中的问题,实现全过程高精度的数字化、智能化,具有从根本上解决该领域当前痛点问题的潜力。数字孪生技术包括的对象及其相互关系如图1所示。
图1 数据中心数字孪生关系图
数据中心数字孪生具备以下几个明显的优势特征。
a) 确保真实。虚拟数据中心是对实体数据中心进行数字化而构建的模型,实体数据中心的各项指标和变化能够真实地呈现在虚拟数据中心中
b) 实时交互。虚拟数据中心所处状态是实体数据中心状态的实时虚拟映射,二者的数据及指令相互实时流动。根据实体数据中心的各项真实数据,通过对数字孪生体进行仿真,实现对真实数据中心未来状态的模拟预测,辅助做出更合理的运营策略;通过虚拟数据中心进行监测,预先觉察即将可能发生的故障,使得运维人员能更从容地处理该问题。
c) 智慧共生。数字孪生系统内部各系统之间通过同步共用大数据分析、AI技术,在全生命周期内达到智慧共生,为数据中心设计智能化及安全运营、绿色运营、高效运营提供全过程智能化服务。
根据数据中心数字孪生的典型特征,可以提出一种数据中心数字孪生的体系架构,如图2所示。
图2 数据中心数字孪生体系架构
0 3数据中心全过程数字孪生关键技术
数据中心全生命周期全过程数字孪生包括以下五大关键技术:通过智能化设计仿真工具实现设计阶段的数字孪生,通过AI健康管理和AI节能调优实现运营和优化阶段的数字孪生,通过多场景可视化验证工具可验证人工智能的安全可靠性,并反馈设计阶段和运营阶段,最终通过数字孪生平台实现全生命周期的数据流通、准确映射和模型自主更新。
3.1 基于数字孪生的机房空间、电力及制冷设计方案自动寻优方法
基于数字孪生的机房空间、电力及制冷设计方案自动寻优方法是一种根据设计需求、大数据分析和AI算法自动生成模块化数据机房空间布局方案的智能化设计方法,为传统设计方式需要投入大量人力、反复试错、难以找到最优解决方案的难题提供数字化解决方案。
本方法拟引入数字孪生模型为载体,以运行能效和经济性指标为目标函数,在设计层面提出一种整体-局部迭代的优化设计和改造模式,以改变现有粗放式设计。本模式以设计条件和设计标准为基础,结合不同功率机柜的实际需求,对数据机房进行自动模块化分析设计,发现空间、电力、制冷等多维度的最优设计方案;在优化层面,融入新型再生能源和节能新技术,包括储冷储热、光伏发电、太阳能光电光热和新型储电储热技术,优化算法根据目标函数寻找出最优的可再生能源及新技术组合和容量,同时利用基于3D CFD气流组织仿真工具的智能AI技术气流组织参数优化算法,实现基于仿真结果的优化参数的采集,为自动寻优模型提供数据支撑。
整体上,数据机房智能化方案设计模型可上传到基于BIM的数据中心全生命周期数字孪生平台,与平台其他模块实现数据互通,同时成果实现3D可视化,输入修改意见可迭代优化,与传统设计相比预计节约80%时间,显著提升生产效率。
3.2 基于数字孪生的机房电气及制冷空调实时能量管理与优化方法
基于数字孪生的机房及制冷空调实时能量管理与优化方法是一种在3D智能气流组织仿真软件为机房设计运行全过程提供仿真支持的基础上,建立人工智能算法分析体系,实时计算机房制冷系统最优运行参数及策略,结合配套的数据中心群控软件平台实现数据中心能源系统运行状态的自动控制和优化的方法。通过建立以基于MPC模型强化学习算法为核心的算法分析体系,进而形成数据中心能源系统实时优化算法和能耗评估模型,避免数据中心低水平重复建设,赋能数据中心的日常绿色生产和高效运营;同时引入智能能耗感知、精确能量控制和能量优化调度一体化等关键技术,实现对数据中心PUE的智能优化及能量智能管理调度的实时全局提升。
以某数据中心为例,该数据中心装机运行时间约为10年,通过对机房用能设备耗电情况统计,调整冷却塔运行工况获取更低冷却水温,提高冷水主机出水温度,其次,通过最不利压差控制,达到冷冻侧流量及水泵最佳运行效率,通过增加末端空调水阀开启程度,降低风机功耗,综合多个控制变量的最优设定值,通过AI智能调控实施策略,预期实现15%的实际运行节能率,实现算力中心绿色低碳智慧运营。其中,AI节能调优技术路线主要分为如下4步:数据集中监控、数据预处理、系统调优算法、策略寻优模型(如图3)。
整体上,数据中心AI节能调优模块是数据中心机房设计运行全过程数字孪生技术的关键一环,通过AI节能降碳赋能数据中心,实现制冷系统精确按需制冷、集中管理、寻优控制、自动调整,将会有效改善数据中心目前核心的效能问题。
图3 AI节能调优技术路线图
3.3基于数字孪生的数据中心机房健康管理技术
基于数字孪生的数据中心机房健康管理技术是一种基于数据中心数字孪生模型和大数据技术实现对供电系统、蓄电池、制冷系统典型故障的实时检测诊断并预警,并提出供电、制冷系统的健康管理建议的方法。首先,基于对数据中心供电系统、制冷系统、环境的精细化数据采集,结合数字孪生技术构建供电系统数字化逻辑树、空间热场、气流组织仿真,重建数据中心的动力、制冷、机架模拟物理及数字空间;
通过建立诊断专家模型和自动寻优算法模型,实现供电系统、制冷系统的早期预警,故障告警可视化,快速处理的流程化。其次,通过三维空间重建,实现数据中心的功率场、热力场实时展现,动态分析机房热点,自动调整气流组织实现高效低碳运行,为客户提供迅捷的上架规划方案;进一步,通过蓄电池参数采集及人工智能算法,准确预测每套电池系统的剩余容量及放电时长,提出电池健康管理建议。
3.4数据中心数字孪生运营多场景可视化验证
数据中心数字孪生运营多场景可视化验证是一种通过自动参数辨识、极值优化算法,对自动寻优模型进行验证的技术,相关技术措施主要包括3个部分。
a) 基于数值方法与计算机辅助技术建立云仿真平台,对AI节能调优的策略结果从专业领域角度进行可视化验证。
b) 通过开发自动参数辨识、极值优化算法,构建自动寻优模型,并分别在新建和存量机房的不同工况、不同负载率的多种场景下进行验证。
c) 开发多种故障场景的应急预案编排及模拟演练功能,为应急保障预案提供辅助支持。通过数据中心数字孪生运营多场景可视化验证技术,实现随机设定定向场景下的数据中心AI运营以及AI运营过程的可视化;同时固化测试验证标准和方法,进而验证数字孪生系统的实际节能效果及运行安全可靠性。
整体上,运营多场景验证模块实现与数据中心AI节能调优、AI健康管理等模块的数据流通,进而为运维人员采用AI调优策略提供决策支持,以及为设计人员就模块化数据机房智能化空间布局方案提供仿真验证。
3.5基于BIM的数据中心数字孪生全过程平台
针对数字孪生应用模块在数据中心设计、运营全过程的数据流通问题,提出领域知识驱动的数据中心机房数字孪生模型自动生成和辨识方法,开发数据中心通用构件库及数据共享系统,实现数字孪生应用的统一接入;解决实数据中心与虚拟数据中心的准确映射和模型自主更新问题,实现平台模型数据与真实机房实时保持同步。经过开发基于BIM模型轻量化场景构建平台和BIM模型轻量化插件,大幅度降低人工建模工作量。
BIM模型轻量化场景构建平台首先将revit模型导出为可在Web端展示的轻量化BIM模型,并将其上传到模型库中;通过数据采集系统或其他三维建模软件获得相应场景的模型数据文件,经解析后得到场景内模型类型和模型的空间位置信息;最终利用这些信息从模型库调取相应的模型并放到正确的空间位置上,在网页端复原Revit中设计的场景,完成场景的轻量化BIM模型构建。
BIM模型轻量化技术由2个部分组成,分别为Revit客户端开发的插件和Web端开发的模型库。模型轻量化插件通过Revit提供的二次开发API,获取模型贴图、材质、模型参数等信息并输出为通用的glb/gltf格式3D模型。期间可将模型的业务参数、场景空间信息等一并输出到模型文件里;模型库管理平台通过Three.js在Web端加载、渲染Revit导出的模型,并根据解析信息将模型及其数据上传到中央模型库,供系统业务使用。
机房模型快速构建同样分为数据采集和模型构建2个部分。场景数据采集可以是由机房传感器采集的设备变动信息,也可以是其他具有二次开发接口的建模软件如Revit、Sketchup、UG等。这些数据源获得数据后,需要将采集到的设备类别型号信息和设备的位置、姿态信息按照通用的JSON格式输出或存放到约定位置等待构建时解析数据;自动化模型构建平台需要有强大的中央模型库的支持。通过解析提取json数据中的设备类别和设备空间姿态信息,从中央模型库中获取到设备对应的模型,并根据提取的位置、旋转、缩放等信息把模型放到对应的位置,达到快速构建出场景的效果。该过程自由度高,可以选择完全自动化,也可选择手动编辑构建。
通过研发的工具和平台最终实现了基础设施数字化表征数据库描述完整性不低于90%、模型与实体映射精度不低于90%的目标。
数据中心全过程数字孪生技术通过数学建模、大数据分析、仿真、AI技术,为数据中心设计智能化、建设智能化以及数据中心的安全运营、绿色运营、高效运营提供增值服务。数据中心能耗成本占总体运营成本的50%以上,通过数字孪生应用可在不间断业务的情况下大幅提升能效,使用前景广阔,经济效益可观。
数字孪生技术融合工程和人工智能多学科专业知识,研发难度较大,该领域仍有不少工具例如气流仿真软件以国外软件为主,通过工程人员和软件人员密切合作,在我国相对薄弱的工业软件领域取得突破,将有力保障国家数据安全,助力软件强国。目前数据中心领域人工智能应用仍处于初级阶段,该技术的全面推广应用将会带动数据中心行业提升精细化、智能化水平,改变数据中心营销、设计、建设、运营的全流程,建立全新的运营模式,降低对数据中心从业人员稀缺专业技能的依赖,具有重要的市场前景和带动作用。
来源:邮电设计技术 作者:贺晓 许俊等
相关标签: