当前位置:首页 > 数据中心 > 正文

论数据中心的终极目标


一、如何提高运维管理工作效率?1、以终为始
以终为始是一种结果导向的思维方式,它提醒人们在做事情之前先明确做事的最终目的。数据中心的最终目标是支持业务系统的不间断运行。在我们接手数据中心的运维任务之前,首先要明确业务连续性目标,然后制定相应的运维策略。
2.以人为本
70%的数据中心故障是由人造成的。同时,即使拥有最先进的监控系统,数据中心内的主动维护操作和应急响应仍然必须依赖于人员的最终决策和操作。因此,拥有足够、负责且经验丰富的人员对于数据中心的安全运行至关重要。
3.培训与学习
学习是一种实践。有句话说“最好的运维团队是在犯了足够多的错误之后才培养出来的”。数据中心基础设施涉及电力、水暖、弱电、消防、建筑等多个主要领域,对于数据中心的运维团队来说,有很多专业知识需要学习。同时,每个数据中的配置和具体操作流程都不同。因此,培训和学习应该成为运维团队管理的重要组成部分。
4.建立管理体系
数据中心基础设施运维管理的管理对象包括整个庞大的基础设施、运维团队、服务对象(IT部门或IDC客户)。必须建立管理体系。整个运维管理体系中最重要的三个方面是设备维护体系、与各相关部门的沟通机制以及支撑数据中心全生命周期管理的财务预算体系。
5.标准化操作流程
任何标准化的业务管理都不可避免地要引入流程,数据中心运维管理也不例外。仅仅基于个人经验和判断的操作往往会隐藏重大的错误风险。数据中心就是要加强流程管理。任何重要的操作都必须严格按照流程进行。建立流程文化是数据中心标准化管理的重要组成部分。数据中心最重要的三种流程是标准操作程序(SOP)、维护操作程序(MOP)和应急准备程序(EOP)。
6.动态管控
数据中心除了前面提到的管理系统和操作流程等相对静态的工作外,还需要动态管控。近年来,IT工作负载的动态特性变得越来越明显。一方面,IT设备增长较快。启动新的业务系统可能会导致短期内IT负载显着增加。另一方面,企业大规模采用虚拟化技术后,数据机房各个机柜的IT负载在一天之内就会发生显着变化。基础设施运维团队必须针对这种IT负载的动态特性实施相应的对策。
7.持续改进
大型数据中心的兴起只是最近几年的事情。当数据中心超过一定规模时,管理变得复杂,已经超越了仅依靠少数运维人员负责的时代。需要的是一套完整的管理方法和方法。国内数据中心基础设施运维体系的成熟度大致在三个层面:基础层面、成长层面和文化层面。
8.使用工具进行运维管理
实践证明,使用优秀的运维管理系统可以显着提高运维效率。可以简化运维流程,并且可以为每个运维事件设置时间限制。监督运维工程师解决错误。此外,运维经理可以通过PC或移动终端随时了解运维事件的进展情况。运维管理工具的知识库、配置管理、拓扑图、监控管理等功能也是提高运维效率的有效功能。