当前位置:首页 > 数据中心 > 正文

数据中心基础设施运维小知识(数据中心基础运维)


一、如何进行数据中心基础设施的管理

设备是数据中心基础设施的子集,设备维护是保证基础设施稳定运行的重要措施。设备维护工作主要包括维护程序的制定、预防性维护工作的执行、维护记录的管理和故障的处理。

运维流程为设备维护提供了指引和依据。数据中心管理人员首先要保证每个维护流程的正确性、完整性和完整性,同时,通过反复操作。培训和演练使运维人员熟悉、理解流程并在实际工作中严格执行。

操作和维护流程一般包括三大类:标准操作程序(SOP)、维护操作程序(MOP)和紧急操作程序(EOP)。

1.简单来说,标准操作程序是指启动和停止设备的步骤。数据中心内任何型号的设备都必须有一个SOP。这里值得一提的是,同类型的设备可以有不同的型号。例如,空调可以有两种制冷能力:60kW和80kW。不同类型的设备启动和停止的操作步骤可能不同。因此,SOP必须基于单独编写的不同模型。

2.维护作业过程包括设备维护、保养、预防性检查等过程内容。通常,MOP会包含SOP条目,因为无论是维护、维修还是检查,都经常需要执行。开机和关机操作。对于主要设备,每个型号必须有SOP和MOP;辅助设备(阀门等)可以进行分类和定义,每种类型都有单独的SOP和MOP。

3.每个数据中心应至少有7-10个应急操作程序(EOP),主要涉及停电、空调故障、火灾、防洪、安全、信息安全等领域。当数据中心出现异常情况时,往往是多系统、多专业的响应。因此,在训练和日常演习中,必须交叉启动多个应急预案,为可能出现的情况做好充分准备。实践中发生。


二、IDC机房维护工作都有哪些数据中心的运维可以分为两大类,一是基础设施的运维,二是基础环境的运维(IaaS类)
下面逐步细分:
1.1.2机房设备准入管理(管理工具如:设备输入输出申请、设备双电源要求,最重要的是机房设备簿)
1.1.3机房负载搬运(可通过控制进入机房的设备重量来降低负载风险)
1.1.4机房环境温湿度管理(巡检数据管理)
1.1.5机房能源管理(通过巡检数据进行管理)
1.1.6机房监控管理(通过进出机房的人数和1.1.5)第1章人员进出对比
1.1.7机房线缆的管理,即网线(包括存储线缆等)、光纤、电力线的管理(内容主要围绕水平带和垂直带轮转,皮带紧窄、电源线长度预留等)
执行上述人员素质不宜太高,但请注意,管理上述执行人员的领导者(组长、组长)起决定性作用在选择中。
工作执行中,工作原则不需要执行者“动脑子”,即通过制定完善的SOP、完整的交付和工作流程体系、处理来指导适用问题。流程
PS:夏天要特别注意,空调的效率会降低。注意并制定应急预案
1.2机房灾难恢复
制定应急预案。机房点包括但不限于空调故障应急预案、环境温湿度较高时的应急预案等。2、基本操作。和维护:
核心环境的运维实际上可以分为周期性工作和非周期性工作指导思想来自ITSM(itil)
术语解释:
Periodic工作
服务请求
事件处理
变更管理
问题风险跟踪日志
2.1周期工作
所谓周期工作就是周期性的、重复的工作,比如:配置备份、账户审核、配置审核、更新各系统操作手册等。不要小看周期性工作其实,它是运维中的一个高重量的工作内容。在工作中,我们将周期性工作纳入运维日历,建立并规范重复性工作,通过制定SOP、检查SOP的执行情况、执行团队对SOP使用情况的反馈以及遵循等方式进行周期性、重复性工作。SOP优化。性工作实施指南。----不知道以上内容是否解释完整如果没有,请留言。
2.2非经常性工作(主要包括服务请求、事件处理、变更管理、问题风险跟踪记录)
本章内容主要围绕流程、SOP和PDCA,那么我们现在需要什么名称定义
定义,服务请求,事件处理,变更管理,问题风险跟踪记录,如果学过或了解ITSM的工程师对上面的名字不熟悉,我也一样。我仔细研究了上面的内容,我的同事和朋友也学习了,但是当我们讨论上面的术语时,我们遇到了一个很大的陌生。比如领导让我在AD中创建一个账户,让我做这个操作其实很简单,但是我应该遵循什么流程呢?
“执行者不需要动脑子,我突然意识到,如果边界不清楚,那么我们定义边界,如何定义它。”输入,即运维工作量化,做一个服务请求分类表,一个事件分类表,一个变更分类表,然后按照机房管理的内容来工作——不知道上面的内容是不是解释得很完整如果没有的话请留言。
以上内容由福林提供
三、idc机房运维需要掌握的知识

IDC机房运维所需知识如下:

网络->存储->协议->需要了解一些方面的需求->开发->测试->安全等,但是有些方面你需要熟悉甚至精通。

比如系统(熟悉使用基本操作系统、nix、windows)、协议、系统开发(日常工作中很重要的是自动化运维相关的开发、大型集群工具的开发和管理))、一般应用(如lvs、ha、web服务器、db、中间件、存储等)、网络、IDC拓扑等。

精通所有的人屈指可数。以上介绍。而维护水平也指日可待,运维工程师的工作量也将相应减少。

对IDC机房运维工程师个人特质的要求:

1沟通能力和团队合作:跨部门、跨类型的运维工作工作量很大,必须善于沟通,有较强的协作能力。

2主动性强,执行力强,精力充沛,抗压能力强。

3.工作中一定要勇敢、细心:只有勇敢,才能创新,才能不走寻常路。尤其是运维这样的新型工种,更需要创新推动发展;如果你细心的话,运维工程师是网站的最佳选择,网上权威最高的人,会后悔一辈子或者被打入地狱。他不小心。

4最后,运营和维护网站需要有探索和创新的精神,通过创新思维决实际问题,因为这是一个处于起步阶段的职业,没有成熟的体系或方法论。学习可以靠大家自己的探索和努力。

5其他基本素质是:头脑聪明、逻辑思维强、谦虚稳重、有归属感、乐于助人、有大局意识。