当前位置:首页 > 数据中心 > 正文

数据中心日常管理


一、数据中心基础设施管理日常维护设备有哪些

维护内容:

1.机房主机设备的维护和管理:计算机服务器(包括PC服务器和存储服务器);网络设备(路由设备等)。

2.机房监控设备维护管理:配电监控系统、环境温度检测系统、门禁设备系统、安防监控设备。

3.维护和操作机房空调及配电设备:空调设备、新风设备、UPS蓄电池、主配电箱。

4.机房消防设备的维护和管理:烟雾、感温探测器、手动报警按钮和报警控制器以及灭火器控制装置。

5.机房供水线路、电路、照明的维护与管理:水路管道、接口的检查与维护。

6.机房的基础维护和管理:机柜电路的布置、标签的检查更换、机房的除尘和清洁、地板、墙壁、天花板、门、窗及相关支撑结构的维护和管理。


二、如何进行数据中心基础设施的管理

设备是数据中心基础设施的子集,设备的维护是保证基础设施稳定运行的重要措施。设备维护工作主要包括维护程序的制定、预防性维护工作的执行、维护档案的管理和故障的处理。

运维流程是设备维护的指导和依据。数据中心管理人员首先要保证每个维护流程的正确性、完整性和全面性,同时通过反复的培训和演练使运维人员充分熟悉和理解流程,并在实际工作中严格执行。

运维流程通常包括三大类:标准操作程序(SOP)、维护操作程序(MOP)和紧急操作程序(EOP)。

1.通俗地说,标准操作程序是指启动和关闭设备的步骤。数据中心内任何型号的设备都必须有一个SOP。这里值得一提的是,同类型的设备可能有不同的型号。例如,空调可能有两种制冷量:60KW和80KW。不同类型设备的启动和关闭操作步骤可能不同,因此SOP应根据不同型号而定。分开写的。

2.维护作业过程包括设备维护、保、预防性检查等过程内容。一般MOP都会包含SOP条目,因为无论是维护、保养还是检查,经常需要进行通电、断电操作。对于主要设备,每个型号必须有SOP和MOP;辅助设备(阀门等)可以进行分类和定义,每种类型都有单独的SOP和MOP。

3.每个数据中心至少应有7到10个应急操作程序(EOP),主要是在停电、空调故障、火灾、防洪、安全、信息安全等方面。当数据中心发生异常情况时,往是多系统、多专业的联动响应。因此,在日常训练和演练中,需要交叉启动多个应急预案,为实践中可能出现的情况做好充足的准备。