当前位置:首页 > 数据中心 > 正文

数据中心运维标准管理(让数据中心运维管理高效简单)


一、IDC机房维护工作都有哪些数据中心运维主要分为两大类,一类是基础设施运维,一类是基础环境运维(IaaS类)
下面逐步细分:
1.基础设施运营和维护:
1.1数据室管理:
1.1.1数据室访问管理(管理工具如:人员管理流程,包括访问申请的审批等)
1.1.2数据机房设备的准入管理(管理工具如:设备准入申请、设备双电源要求、最重要的是机房设备书)
1.1.3机房承重(此负载-通过控制进入机房的设备重量,降低承受风险)
1.1.4机房环境温湿度管理(通过巡检记录管理)
1.1.5机房电源管理(通过巡检记录管理)
1.1.5机房电源管理(通过巡检记录管理)
通过巡检记录)
1.1.6机房监控管理(通过进出机房的人数与1.1.第一章人员进出对比)
1.1.7机房线缆管理,即网线(包括存储线等)、光纤、电源线管理(内容主要涉及水平与垂直、扎带紧与紧、电源线长度预留等。)
执行上述人员的素质不必很高,但请注意,领导上述执行人员的经理(组长、组长)在选择上具有决定性作用。
执行工作时,工作原则不需要执行者“动脑子”,即通过创建完善的SOP、完整的交接体系、可实施的工作流程和问题管理流程来操作
PS:夏天要特别注意,空调的效率会降低。了解并制定应急预案
1.2机房灾难恢复
制定应急预案。机房重点包括但不限于空调故障应急预案、环境温湿度高时应急预案等。
2、基本环境操作。和维护:
基础环境运维实际上可以分为周期性工作和非周期性工作。指导思想来自ITSM(itil)
术语解释:
定期工作
服务请求
事件处理
变更管理
问题风险跟踪
2.1周期性工作
所谓周期性工作是指周期性的、重复性的工作,例如::备份配置、账户审核、配置审核、更新各个系统的用户手册等。不要小看周期性工作。事实上,运维工作内容权重很高。工作中,我们将周期性工作纳入运维日历,剥离和标准化重复性工作,通过制定SOP、检查SOP执行情况、执行团队反馈SOP使用情况、跟踪SOP优化来驱动周期性重复性工作性工作实施指南。----不知道上面的内容有没有解释清楚。如果没有,请留言。
2.2非周期工作(主要包括服务请求、事件管理、变更管理、问题风险跟踪)
本章内容主要是流程、SOP和PDCA,所以我们现在需要定义名词定义、服务请求、事件管理、变更管理、问题风险跟踪,如果学过或了解ITSM的工程师对上面的名字并不陌生的话,我就是。我仔细研究了上面的内容,我的同事和朋友也都学会了,但是当我们讨论上面的概念时,我们遇到了很大的奇怪就是我们各自的理解不一致,而且这个现象已经困扰我们很长时间了。例如,经理让我在AD上创建一个帐户并要求我这样做。这个操作确实很简单,但是应该遵循什么流程呢?
“表演者不需要动脑子,通过这句话,我突然意识到,如果边界不清楚,那么我们定义边界,如何定义它。”介绍一下,就是运维工作量化,创建服务请求分类表、事件分类表、变更分类表,然后根据数据机房管理的内容进行工作——不知道上面的内容是不是解释得很详细如果没有的话请留言。
以上内容由福林提供
二、运维管理的标准定义运营管理(ITOperationsManagement)帮助企业创建快速响应、适应企业业务环境和业务发展的IT运维模式,实现基于ITIL的流程框架和运维自动化。
主要思想随着国内企业业务信息化的不断深入,IT运维部门负责的IT设备和软件的运维变得越来越复杂,技术难度也越来越大。传统IT工具和流程侧重于技术而不是业务目标。业务服务管理(BusinessServiceManagement)使IT能够轻松满足业务需求并改造企业环境,使IT部门负责人能够拥有统一的语言,通过统一的界面面对挑战并了解新变化的影响。
BSM主要强调从业务的角度来看待IT的运维,以最大限度地发挥IT对企业业务的推动作用。
聚焦IT系统业务服务管理的主要着力点
1、树立以业务价值管理为基础、业务驱动管理的思想,首先要在战略层面建立“业务驱动”IT管​​理水平IT治理和管理的思路使业务部门的目标和IT运维的目标,既为实现企业总体战略目标提供能力支撑,又作为管理有效性的考核IT系统的有效性和IT部门的工作。只有这样,才能在整个企业中形成“技术为业务发展服务”的意识和文化,实现IT与业务的融合,共同服务于企业的战略目标。
2.创建领先的业务服务模型如今的业务部门比过去加依赖于应用程序。应用软件可以实现关键业务流程的自动化——自动化包括支付、资金转账、下订单和订单履行。由于应用程序故障或性能问题可能会对业务造成严重影响,因此业务部门迫切需要IT在出现问题时提供更高水平的应用程序服务并更快地解决问题。因此,有必要根据企业战略和当前业务运营情况,识别企业业务服务,特别是关键业务应用。服务于这些核心业务系统,创建符合企业未来发展愿景、当前IT架构、管理模式等的业务服务模型,能够清晰地描述业务与IT的关系以及IT服务的主要目标。
3、管理信息交互目前,由于对IT资源专业化、精细化管理的要求,企业部署了许多监控和管理工具,如网络监控、系统监控、数据库监控等。一般来说,这些监控工具往往来自不同的制造商,并且缺乏相互共享信息的手段。具体业务由网络本身、主机和应用组成,管理信息不能共享。这意味着当故障发生时,系统无法直接自动分析定位故障点,增加了IT分析的难度。错误,降低解决问题的效率。业务服务管理可以有效整合企业已建设的多个IT监控系统,将分散的IT管理信息集中到单点管理平台,以便快速定位错误。
四、寻找根本问题随着企业业务的快速发展,IT环境越来越复杂,IT组件越来越多,同时组件之间的关系也越来越复杂。业务服务管理可以提供有效的问题根源查找能力。它专注于企业的核心业务系统。在业务模型中对系统任意点进行快速根源问题分析和定位,大大提高了故障排除的速度和准确性。
5.评估错误的影响程度当我们发现IT缺陷时,不仅要关注缺陷本身,还要考虑错误对业务系统的影响。通过创建业务服务影响拓扑,您可以快速了解企业的​​核心业务以及业务障时的影响程度。