当前位置:首页 > 数据中心 > 正文

数据中心机房运维服务方案


一、IDC机房维护方法

IDC机房维护方法

维护目的

为保证机房设备的正常运行,通过检查、定期维护和保养机房的环境支撑系统、监控设备、计算机主机设备的维护,保证机房设备的稳定运行。通过维护,延长设备的生命周期,降低故障率。确保当出现突发事件导致硬件设备出现故障,影响机房正常运行时,机房能够及时得到供应商的技术支持和产品维护,提供设备或维护人员对机房进行维护并快速解决。错误。

具体维护方法

1、机房吸尘及环境要求:定期对设备进行吸尘、清洁并调节监控摄像头内部温度,防止灰尘进入。由于机器运转、静电等因素吸入监控设备而传播。同时检查机房内的通风系统、散热、滤尘器、电源、高架防静电地板等设备。机房室内温度应控制在+5℃~+35℃,相对湿度控制在10%~80%。[1]

2、维护机房空调及新风:检查空调运转是否正常,换气装置工作是否正常。通过视液镜观察制冷剂液位,判断制冷剂是否不足。检查空调压缩机、干燥过滤器等附件的高低压保护开关。

3、UPS及电池维护:根据实际情况检查电池容量;对电池进行充放电维护,调整充电电流,保证电池正常工作;谐波含量,对地电压为零;检查所有参数是否配置正确;定期进行UPS功能测试,例如测试UPS与市电之间的切换。

4.维护消防设备:检查自检、消音、复位功能及主备电源切换功能;火灾报警控制器。

5.电气及照明电路的维护:及时更换镇流器和灯具、更换开关;线端氧化处理,检查更换供电线路绝缘标贴,防止短路;

6、机房基本维护:清洁静电地板,清除地面污垢;调整间隙,更换损坏部件;检查接地电阻;清除主要接地点的锈迹,紧固连接;避雷针;接地线接触增强抗氧化能力。

7.机房运维管理系统:完善机房运维技术参数,优化机房运维管理系统。维护人员24/24及时响应。


二、IDC机房维护工作都有哪些数据中心的运维可以分为两大类,一是基础设施的运维,二是基础环境的运维(IaaS类)
下面逐步细分:
1.基础设施运维:
1.1机房管理:
1.1.1机房人员访问管理(管理工具如:人员管理流程包括访问请求的审批等)
1.1.2管理机房设备准入(管理工具如:设备准入申请、设备双电要求,最重要的是机房设备台账)
1.1.3机房承重(承担风险)通过控制进入机房的设备重量来减轻负载)
1.1.4机房环境温湿度管理(通过巡检记录管理)
1.1.5机房电源管理(通过巡检记录管理)
1.1.6监控及机房管理(通过进出机房的人数和1.1.第一章人员访问情况对比)
1.1.7机房线缆管理,即网络电缆(包括存储电缆等)、光纤和电源线管理(内容主要围绕横绳、竖绳、紧紧、电源线长度排序等)组长、组长)管理上述内容的人执行者的选择很重要。
在工作执行中,工作原则不需要执行者“动脑子”,即通过创建完善的SOP完整的交付体系、可行的工作流程和问题处理来激活它。流程
PS:夏天要特别注意,因为空调效率会降低注意并写好应急预案
1.2机房灾难恢复
制定应急预案。用于计算机房。要点包括但不限于路电故障时空调故障应急预案、环境温湿度较高时应急预案等
2、维护:
基础环境的运维实上可以分为周期性工作和非周期性工作。指导思想来自ITSM(itil)
术语解释:
定期工作
服务请求
事件处理
变更管理
问题风险跟踪记录
2.1周期性工作
所谓周期性工作是指周期性的、重复性的工作,例如:配置备份、账户审核、配置审核、更新各系统操作手册等。不要小看周期性工作,其实就是运维中的重工作内容。在工作中,我们将周期性工作纳入运维日历,对重复性工作进行精简和标准化,通过制定SOP、审核SOP实施情况、实施团队对SOP使用情况的反馈、SOP优化等方式进行周期性重复性工作向上的动作。性工作实施指南。----不知道上面的内容是否已经解释清楚了,如果没有,请留言。
2.2非周期工作(主要包括服务请求、事件处理、变更管理、问题风险检测记录)
本章内容主要围绕流程、SOP和PDCA,所以我们现在需要定义名词定义、服务请求、事件处理、变更管理、问题风险检测记录,如果学过了解ITSM的工程师对以上名字很熟悉,那么我也熟悉。我仔细研究过上面的内容,我的朋友和同事也研究过,但是当我们讨论上面的术语时,我们面临的一个很大的陌生就是我们理解上的不一致,而这个现象困扰了我们很长时间。比如老板让我在AD中创建一个账户,让我去做这个操作其实很简单,但是我应该遵循什么流程呢?
“执行者不需要动脑子。”通过这句话,我突然意识到,如果边界不清晰,那么我们定义边界以及如何定义它进行介绍,即运维计算工作,创建服务请求分类表,事件分类表,变更分类表,然后根据机房管理内容进行工作——不知道上面的内容是否已经解释清楚了,如果没有,请留言。
以上内容由福林提供