当前位置:首页 > 数据中心 > 正文

数据中心运行维护和管理的标准(数据中心运维管理指标)

疫情期间如何维持数据中心的正常运行

当前疫情对大家工作生活的影响是显而易见的,那么疫情期间,数据中心运维人员如何维护数据中心的运行呢?跟着我来看看中国运通吧。


1.强化访客安全保障机制

访客欲前往数据中心时,须提交访客登记表、提交核酸报告、签署责任确认书。

访客到达数据中心时,将测量体温,检查出行码和健康码,必须佩戴口罩并进行消毒。


二、构建基础设施运维监控体系(DCIM)


实时监控

图形界面实时监控所有物理基础设施的参数和状态,及时准确地收集运营信息;

报告错误

主动识别事件并快速将其推送至管理岗位通过许多不同的方法,例如电话、短信、应用程序和网站。

终端设备管理

使用手持终端(手机、PAD等)进行监控管理、查看告警、检查电子化学品;

能效计算

能效计算

计算PUE并分配能耗,了解机房能效真相;

统计报表

运维侧根据报表格式、配置文件、规则计算自动生成报表,取代人工复制和统计;

热备份

提供高可靠架构,主备系统自动实现切换,保证运维不间断;



三是制定层层应对预案

根据情况培养人员根据政府建议、必须遵循的安全预防措施以及出现阳性病例或潜在疫情时应采取的措施,制定人员配置分层计划的矩阵。


四。建立备份数据中心

为了防止疫情导致数据中心损坏而无法访问,需要建立备份数据中心来解决,避免单个数据发生事件时束手无策中心。


年份。监测体温和健康状况

监测员工体温和发烧情况,并使用非接触式测温设备测量要求测量在设施内工作的任何人的体温。地点和员工还必须填写一份报告上班前的健康状况。



6.为员工配备防护装备

即使员工没有出现症状,也必须佩戴口罩、面罩、手套等防护装备。保持社交距离并限制与其他外人的过度接触。


7.清洁消毒

要经常洗手,使用后擦拭接触设备,并使用高酒精浓度的清洁液清洁接触点和区域。杀菌区域——例如门把手并访问读者。

通过上述措施,相信我们数据中心的工作人员一定能够在疫情期间维持数据中心的正常运行,用责任来保障公司核心数字资产的安全运行。

最后借一首诗来表达我们对美丽春天的向往。我们相信,在党和政府的领导下,中国人民一定能够战胜疫情!

《柳赋》——唐和知章

碧玉高如树,垂下万条青丝。

不知细叶谁剪,二月春风如剪刀。


如何进行数据中心基础设施的管理

设备是数据中心基础设施的子集,设备的维护是保证基础设施稳定运行的重要措施。设备维护工作主要包括维护程序的制定、预防性维护工作的执行、维护档案的管理和故障的处理。

运维流程是设备维护的指导和依据。数据中心管理人员首先要保证每个维护流程的正确性、完整性和全面性,同时通过反复的培训和演练使运维人员充分熟悉和理解流程,并在实际工作中严格执行。

运维流程通常包括三大类:标准操作程序(SOP)、维护操作程序(MOP)和紧急操作程序(EOP)。

1.通俗地说,标准操作程序是指启动和关闭设备的步骤。数据中心内任何型号的设备都必须有一个SOP。这里值得一提的是,同类型的设备可能有不同的型号。例如,空调可能有两种制冷量:60KW和80KW。不同类型设备的启动和关闭操作步骤可能不同,因此SOP应根据不同型号而定。分开写的。

2.维护作业过程包括设备维护、保养、预性检查等过程内容。一般MOP都会包含SOP条目,因为无论是维护、保养还是检查,经常需要进行通电、断电操作。对于主要设备,每个型号必须有SOP和MOP;辅助设备(阀门等)可以进行分类和定义,每种类型都有单独的SOP和MOP。

3.每个数据中心至少应有7到10个应急操作程序(EOP),主要是在停电、空调故障、火灾、防洪、安全、信息安全等方面。当数据中心发生异常情况时,往往是多系统、多专业的联动响应。因此,在日常训练和演练中,需要交叉启动多个应急预案,为实践中可能出现的情况做好充足的准备。