数据中心工程的验证测试和典型高风险问题应对

本文介绍了数据中心验证测试的流程,对验证测试中发现的问题按照风险等级以及建设阶段进行分类,并结合公司近年来承接的数据中心项目测试验证所提出的问题,对各专业的典型高风险问题进行了归纳总结,提出了相应的应对措施,为类似的工程履约提供借鉴和参考。

本文来自微信公众号“CDCC”。

关键词:数据中心;验证测试;典型问题;应对举措

一、验证测试及流程

数据中心工程具有“安全、可靠且不间断运行”的需求,为此空调制冷、电气系统等均进行冗余设计,施工过程中施工人员精心组织、严苛实施材料、设备的采购和施工工艺,以确保工程品质,数据中心投入使用前还必须进行非常严格和高规格的验证测试。一栋25000㎡数据中心楼的整体工期一般为9-11个月,其中验证测试工作占2个月时间。验证测试工作是数据机房安全可靠、不间断运行的强有力保障措施,通常会聘请独立的第三方检测机构来完成,施工单位全力配合,并对验证测试过程中发现的问题百分之百地修改、完善。通常数据中心验证测试重点关注的机电系统内容主要包括电气专业、空调专业、弱电控制专业以及消防专业四大部分,逐项验证测试这四大专业的施工质量与使用功能冋。

数据中心的验证测试流程一般分为三个阶段(见图1)。第一阶段为安装工艺检查阶段,主要对施工安装过程的质量进行检查,包括设备安装位置、安装方式是否符合图纸、规范与使用要求,所有线路是否按图准确施工连接等问题;第二阶段为功能测试阶段,主要对各个设备的功能进行单机测试。该阶段类似于传统机电系统调试过程中的单机试运转,排除所有设备的问题后,开始进入第三阶段;第三阶段为系统联调,包括系统的自动控制逻辑验证以及动态环境监控功能的正常运行。该阶段一般包括各个专业的协同运转,保证数据中心各系统的安全稳定运行。整个验证测试流程层层递进,严格把关,不放过任何一处影响使用功能的问题或隐患。一栋25000㎡数据中心楼应急柴油发电系统的验证测试,过程中消耗的柴油造价近50万元。

4d2d9464a416b0e266cdeaeefec1b03d (1).jpg

图1数据中心验证测试流程

二、验证测试问题的分类

验证测试单位在各环节检查过程中,会记录发现的具体问题,形成问题清单。根据对数据机房使用功能影响的严重程度,将问题划分高、中、低三个风险等级;每个风险等级中又按照专业进行划分。

1、按风险等级分类

高风险问题一般是指与技术要求、合同、图纸或规范存在严重不符或严重质量问题,影响机房正常的功能使用,或存在对人员、设备的重大安全隐患。该类问题必须立刻整改销项,否则系统正式投用后将无法整改或者整改难度较大。中风险问题一般是与技术要求、合同、图纸或规范存在不符或质量问题。该类问题可能影响到系统的稳定运行,但是后期整改不影响业务正常运行。低风险问题一般集中在对后期维修维护影响较小,易维修维护的问题。该类问题一般集中在施工细节方面。按照风险等级的分类依据见表1。

1.png

2、按建设阶段分类

在每个风险等级下,为了分析不同专业在不同建设环节出现问题的情况,对问题又可以按照工程建设阶段划分为设计问题、施工问题、产品问题、调试问题以及其他问题五个大类。

对于设计问题,可以分为两种类型,一是原设计存在设计缺陷,二是不同专业间的设备或管道出现功能冲突的问题,可归类于未进行深化设计问题。施工问题主要有四种,按照施工完成的程度可以分为未按图施工、未完成施工、安装质量不合格以及专业之间不配套;对于专业之间不配套,主要体现在需要不同专业间协作时存在的问题。产品问题相对特殊,由于不同专业之间的设备产品不尽相同,因此其需要根据专业不同进行再分类。调试问题主要有设备单体运行异常、仪器仪表功能异常、系统贯通以及系统联调四类问题,前三类一般是单机试运行时的问题,系统联调问题一般是单系统多设备或者多系统模拟运行时出现的问题。第五个类别为其他问题,主要包括了清洁整顿、土建问题以及精装问题。按建设阶段进行分类的主要类别与具体类别见表2。

1.png

不同专业中的设备与产品有所不同,各专业中容易出现问题的主要设备及具体分类见表3。不同专业的主要的产品问题,能够为设备采购和验收的环节提供参考。

1.png

三、验证测试常见问题分析及其对策

项目团队对公司近年来已完成验证测试项目的问题清单进行了统计和分析,现将数据中心工程量较集中、问题较多的电气、空调和弱电控制等3个专业的高风险问题进行阐述,归类出主要问题,并给出相应的对策建议。

1、电气专业

经过分类统计,电气专业中高风险问题在各专业中占比最高,约45.3%。其中施工问题的数量最多,这和数据中心电气专业工程量最大也是相符合的,并且电气专业贯穿后端运维保障与前端机柜运行。其次是产品问题也较多,问题最为突出的是高中低压配电柜以及蓄电池。值得指出的是,其他问题中的清洁整顿问题的数量也占有相当大的比重,主要表现在配电柜内存在金属杂物,以及开关接触器存在灰尘。电气专业的主要问题分布及其主要问题点和对策见表4。

1.png

2、空调专业

暖通空调专业的高风险问题占全部高风险问题的23.2%。问题较为突出的仍然是施工问题,具体表现为安装质量不合格与未按图施工,需要在未来施工过程中注意施工水平与施工细节。其次是产品问题,出现问题较多的设备为精密空调,同时阀门在环境营造与自动控制中扮演重要角色,其功能出现问题后一般的问题风险等级都较高。值得指出的是设计问题,在暖通空调专业中,设计大量管线综合排布的问题,若前期不进行合理的深化设计,后期出现高风险问题的几率也较高。暖通空调专业的主要问题分布及其主要问题点和对策见表5。

1.png

3、弱电控制专业

弱电控制专业的高风险问题占全部高风险问题的22.6%。该专业的问题中七成多均为产品问题,尤其是动态环境检测系统(简称“动环系统”)与控制系统的问题。其次是调试问题,主要体现在系统采集数据问题以及系统联调两个方面。弱电控制专业的施工一般由专业分包进行,其主要问题分布及其主要问题点和对策见表6。

1.png

四、结语

数据中心验证测试工作是数据机房安全可靠、不间断运行的强有力保障措施,而验证测试阶段是检验数据中心功能实现的最后一道防线。对出现问题的分析能够从结果出发,促进施工环节提质增效,也能够从源头遏制问题出现的难度与数量。本文提出的各专业典型高风险问题的应对对策,以期为同类型的工程履约提供借鉴和参考。

作者:尚升、高惠润、张仟、周强

参考文献:

[1]林小村.数据中心建设与运行管理[M].北京:科学出版社,2010.

[2]丁聪.浅析IDC基础设施第三方验证测试[J].邮电设计技术,2015(7):67-72.

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论