数据中心基础设施运维之应急处理

人类在对于灾难的承担与付出中,实现了向更高程度文明过渡的历程,数据中心的基础设施运维也是如此。如果说,处于高风险社会的事实,以暴乱、洪水、矿难、重大污染事件为标志的各类事故灾难类突发公共事件在近年来的集中发生,是对于中国当下政治、社会的重大考验。那么停电、停水、火灾、洪水等意外事件的发生,对于数据中心的连续不间断运营也提出了前所未有的挑战。    

本文基于业界的最佳实践,对数据中心基础设施运维之应急处理的组织体系、运行机制、应急保障、监督管理等方面进行浅析,探讨了应急处理的目的及意义,给出了应急处理相关名词解释,分析了应急处理的基本原则,研究了应急处理体系建设方式及应急处理物资管理建议,最后本文针对数据中心几种典型场景,给出相应的应急处理建议,供读者参考借鉴。    

读者可以根据自己的实际情况,对本文介绍的数据中心基础设施运维的应急处理进行完善、修改和补充,制定适合自己的数据中心基础设施的应急处理方案。

数据中心基础设施运维之应急处理

一应急处理的目的及意义    

为保障数据中心业务的连续运营,各类数据中心在硬件建设上通过设备及系统的冗余配置,使得数据中心的业务保障能力不断提高。但与此同时,据统计显示,全球每年仍有大量的数据中心由于基础设施运维的应急处理不当,造成部分或全部业务宕机。如何保障数据中心在意外事件发生后能做到有章可循、有据可依,要求各类数据中心必须建立明确的应急处理体系,其目的及意义探讨如下。    

数据中心基础设施运维的应急处理体系确定了应急救援的范围和方法,使数据中心应急管理不再无据可依,无章可循,尤其是通过培训和演练,可以使数据中心应急人员熟悉自己的任务和角色定位,具备完成指定任务所需的相应能力,并检验预案和执行程序,评估应急人员的整体协调性。    

数据中心基础设施运维的应急处理建设,有利于在突发事件来临时做出及时的应急响应,降低事故后果,应急行动对时间要求十分敏感,不允许有任何拖延,应急预案预先明确了应急各方职责和响应程序,在应急资源等方面进行先期准备,可以指导应急救援迅速、高效、有序的开展,将事故造成的人员伤亡、财产损失、环境破坏、运行中断时间等降到最低限度。    

数据中心基础设施运维的应急处理体系是数据中心各类突发事故的应急基础,通过编制应急预案,可以对那些事先无法预料到的突发事故起到基本的应急指导作用,成为开展应急救援的“底线”,在此基础上,可以针对特定事故类别编制专项应急预案,并有针对性地制定应急预案、进行专项应急预案准备和演习。    

数据中心基础设施运维的应急处理体系,建立了与上级单位和部门应急救援体系的衔接,通过编制应急预案,可以确保当发生超过本级应急能力的重大事故时,与有关应急机构的联系和协调。    数据中心基础设施运维的应急处理体系建设,有利于提高风险防范意识,应急预案的编制、评审、发布、宣传、演练、教育和培训,有利于各方了解面临的重大事故及其相应的应急措施,有利于促进各方提高风险防范意识和能力。

二应急处理相关名词解释

应急:应急是一种要求立即采取行动(超出了一般工作程序范围)的状态,以避免事故的发生或减轻事故的后果。

预案:为进行危机管理提前制定的操作计划。

应急信息保障:当数据中心设施遭受破坏、性能降级、异常或执行重要信息保障任务时,通过应急方式来保障信息服务能力。

数据中心保障应急预案:为开展数据中心服务保障工作而提前制定的操作计划,规定了各级单位应对各种突发或重要事件的工作原则、组织机构、应急响应等通用性内容,适用于应对各类突发或重要事件。

重大危险源:指在数据中心园区内或周边,长期地或是临时地生产、搬运、使用或贮存危险性物品,且危险物品的数据等于或超过临界量的,重大危险源历来就是数据中心运营监管重点对象。

分级响应:突发或重要事件发生时,按照分级负责、快速反应的原则,应急响应划分参照国家应急预案标准。

三应急处理的基本原则

数据中心基础设施运维应急处理应遵循以下原则:数据中心基础设施运维应急处理应当遵守国家相关法律法规,遵守数据中心所在地区的行政法律法规。

数据中心基础设施运维应急处理在保障人员生命安全的前提下,积极承担应尽的社会责任,优先确保涉及民生的信息服务安全、畅通。

数据中心基础设施运维应急处理要做到统一领导,分级指挥,充分利用现有资源,突出保障重点。

数据中心基础设施运维应急处理的信息发布应当及时、准确、客观、全面,要积极主动,准确把握,避免猜测性、歪曲性的信息披露等。

四应急处理体系建设

1、应急体系建设    各类数据中心应针对本数据中心基础设施运维的特点,建立基础设施运维应急处理体系,应急体系建设原则如下:(1)总则:包括基础设施运维应急处理体系目的、工作原则、编制依据和适用范围。(2)数据中心基础设施运维应急处理组织指挥体系及职责:包括组织机构和职责、组织体系框架描述。(3)数据中心基础设施运维应急处理的预防和预警机制:包括对预防机制、预警监测、预防预警行动、预警分级和发布的介绍


您可能还会喜欢: