当前位置:首页 > 数据中心 > 正文

数据中心机房运维管理资料


一、idc机房运维需要掌握的知识

运维IDC机房所需的知识如下:

网络->存储->协议->需要了解一些方面的需求->开发->测试->安全等,但是有些方面你需要熟悉甚至掌握。

比如系统(熟悉使用基本操作系统、nix、windows)、协议、系统开发(日常工作中很重要的是自动化运维相关的开发、大型集群工具的开发和管理))和一般应用(如lvs和ha(webserver、db、中间件、存储等)、网络、IDC拓扑等。

掌握以上所有介绍的人屈指可数。如果运维工程师通过运维层级来分离运维知识,实现突破,我相信运维会得到提升。维护水平指日可待,运维工程师的工作量也会相应减少。

IDC机房运维工程师个人素质要求:

1.沟通和团队合作能力:运维工作是跨部门的,工作量很大,必须善于沟通,有较强的团队合作能力。

2.主动性、执行力、干劲高、抗压能力强。

3.工作要大胆、细心:大胆才能创新,不能走寻常路,尤其是运维这样的新工种,需要更多的创新才能促进发展,细心的话,运维工程师是网站的关键,是互联网上拥有最高权力的人,他会后悔一辈子,或者被打入十八层地狱……他不小心。

4.最后,运营和维护网站需要有探索和创新的精神,通过创新思维解决现实生活中的问题,因为这是一个处于起步阶段的职业,没有成熟的体系和方法论。向他们学习。我们可以依靠每个人的探索和努力。

5.其他基本品质包括:聪明的头脑、逻辑思维能力强、谦逊和稳定、熟悉、乐于助人、了解大局。


二、IDC机房维护工作都有哪些数据中心运维可以分为两大类:一是基础设施运维,二是核心环境运维(IaaS类)。
逐步细分以下要素:
1.基础设施运维:
1.1机房管理:
1.1.1机房人员访问管理(管理工具如:人员管理流程包括访问请求审批等)
1.1.2机房设备访问管理(管理工具如:设备输入输出申请、设备双电源要求,最重要的是机房设备台账)
1.1.3机房电梯(通过控制进入机房的设备重量,可降低电梯风险)
1.1.4机房环境温湿度管理(通过巡检记录管理)
1.1.5机房电源管理(通过巡检记录进行管理)
1.1.6机房的监控管理(通过进出机房的人数和1.1.第1章人员进出对比)
1.1.7机房线缆管理,即网线(包括存储线缆等)、光纤、电源的线缆管理(内容主要围绕横向和纵向,紧密围绕以及绑带紧、电源线长度预留等)
执行上述任务的人员素质不需要很高,但请注意管理上述任务的领导(组长、组长)执行者的选择至关重要。
工作执行中,工作原则不需要执行者“动脑子”,即通过制定完善的SOP、系统完整的交接和可实施的工作流程和问题管理来驱动。流程
PS夏天要特别注意,空调效率会降低,细心,写应急预案
1.2机房灾难恢复
制定应急预案。用于计算机房。要点包括但不限于空调故障应急预案、停电应急预案、高环境温湿度应急预案等。
2、基本环境操作。和维护:
基础环境的运维实际上可以分为周期性工作和非周期性工作。指导思想来自ITSM(itil)
术语解释:
定期工作
服务请求
事件处理
变更管理
问题和风险跟踪历史
2.1周期性工作
所谓周期性工作是指周期性、重复性的工作,例如:配置备份、账户审核、配置审核、不同系统操作手册更新等。不要低估周期性工作。其实是运维中非常重要的工作内容。如何合理高效地开展周期性工作?在工作中,我们将周期性工作纳入运维计划,通过制定SOP、验证SOP的执行情况、反馈执行团队对SOP使用情况的反馈、确保重复性工作的落实,对重复性工作进行分配和标准化,开展周期性重复性工作。跟进。SOP的优化。实施性工作的提示。----不知道上面的内容有没有详细解释过。否则请留言。
2.2非周期工作(主要包括服务请求、事件处理、变更管理、问题和风险跟踪记录)
本章内容主要围绕流程、SOP和PDCA,所以我们现在需要的是名字定义
定义、服务请求、事件管理、变更管理、问题和风险跟踪,如果学习或了解ITSM的工程师对上面的名字并不陌生,我也一样。我仔细研究了上面的内容。,我的同事和朋友也学过,但是当我们讨论上面的术语时,却遇到了很大的陌生。所谓陌生,就是我们各自的认识不一致,这种现象困扰了我们很长时间。比如领导让我在AD上创建一个账号,让我去做。这个操作其实很简单,但是应该按照什么步骤呢?
“执行者不需要动脑子。»感谢这句话,我突然意识到,如果界限不明确,那么我们定义界限以及如何定义它。介绍一下,就是运维工作量化,做一个服务请求排行表,一个事件排行表,一个变更排行表,然后按照机房管理的内容来工作——不知道上面的内容是不是已被详细解释。否则请留言。
以上内容由福林提供
三、IDC机房的维护运营

1.机房除尘及环境要求:定期对设备进行除尘、清洁并调整监控摄像头的清晰度,防止因机器运行、静电等因素而吸入灰尘。同时检查机房内的通风、散热、除尘、电源、防静电吊顶地板等设施。机房室内温度应控制在+5℃~+35℃,相对湿度控制在30%-85%。
2.机房空调及新风维护:检查空调系统是否正常工作,换气设备是否正常工作。通过视液镜观察制冷剂液位,判断是否缺少制冷剂。检查空调压缩机高低压断路器、干燥过滤器等附件。
及电池维护:根据实际情况进行电池验证测试;和零地电压;检查各参数配置是否正确;定期进行UPS功能测试,例如B.使用市电进行UPS切换测试。
4.火灾报警系统维护:检查火灾报警器、手动报警按钮、火灾报警器外观并测试报警功能。检查火灾报警控制器的自检、消音、复位功能以及主、应急电源切换功能。
5.电气线路和照明线路维护:及时更换镇流器和灯具,电缆端部氧化处理,检查和更换标签,防止意外短路。
6.机房基本维护:清洁地面、除尘。检查避雷针接地电阻,加强接地触点防氧化。
7.机房运维管理体系:完善机房运维规范,优化机房运维管理体系。维护人员24/7及时响应。