机房设备搬迁实战

李顺海
机房迁移是一项复杂而细致的工作,涉及到多部门互相协调、配合,在机房搬迁开始前制定周密计划、软件和硬件方面的完整准备是完成此项工作的关键。本文分享了医院信息系统机房设备搬迁的实战经验。

本文来自twt企业IT社区,作者/李顺海,某医院系统架构设计师、信息系统项目管理师,作为核心人员,全程参与医院系统设计、管理开发、项目协调。

引言

随着医院业务的不断发展,医疗业务系统的不断完善,通信设备迅速增加。为了能够给患者提供更优质的服务,医院需要对信息系统进行新建、扩容和整合,必然存在机房、网络和硬件设备的优化。

某院新建南院大楼,配备高标准机房,面临数个机房设备的搬迁归整工作。搬迁总共涉及到某院3个机房,分别为现有的主机房、次机房和新机房。机房搬迁对IT资源的转移、升级,包括搬迁前现有系统的备份、搬迁过程的安全和搬迁后系统的完整恢复一系列过程,并且对系统搬迁的时间都有比较严格的要求。

搬迁计划的制定和实践的实施是一个周密的过程,该过程的顺利实现是对现代化医院机房建设和发展的深入理解和有效探索。

一、搬迁原则

1.1总体原则

我们在整体搬迁工作的计划和实施上遵循以下5条基本原则:

(1)注重细节、统筹安排。

(2)抱定一次成功的信心并做好最坏的打算。

(3)组织完毕的保障体系和强大的技术支持体系。

(4)制定完善的应急处理方案。

(5)实施标准化、搬运标准化、操作标准化。

1.2机房规划准则

对新建的机房进行合理的规划,在规划时遵循以下3条原则:

(1)保证网络结构的统筹性。新机房的建设和使用应结合医院的总体规划,同时还应考虑经营策略及今后新业务的发展需要。

(2)保证使用效率的最优化。新机房要严格按照电信专用房屋建设规范设计,其层高、荷重、机房温湿度、洁净度等标准较高,应尽量用于通信设备的安装。

(3)保证设备运营的安全性。对于影响设备正常运行的环境,必须配备相应的设施给予保证,同时新机房楼内的通信电源、专用空调、进局光电缆等系统,可以根据全楼各机房设备安装的具体进度分批进行建设。

1.3搬迁细则

在搬迁之前要对搬迁的内容做充分的调研,分析各个系统在整个通信网络中的地位,根据其重要性确定其搬迁方案。

为保证搬迁的平稳可靠,经过反复论证讨论,确定了“分批搬迁、平稳过渡”的总体搬迁方针,制定了详细的搬迁方案。

对于搬迁的系统,大致可分为2类:

(1)可中断业务的系统:如果设备的搬迁、重新安装调试中断时间能控制在用户可以接受的范围内,在征得主管技术部门的认可后,可考虑将系统中断后整体搬迁。

(2)不可中断业务的系统:对于核心网络中的交换系统、传输系统等不可中断业务的系统,可使用替换设备来临时接管业务,待搬迁结束后再将系统恢复到原设备上。

二、详细搬迁计划及过程

新机房建设竣工,旧机房设备搬迁计划已列入日程,搬迁的设备内容主要为6个大的核心系统的主机、存储、机柜和若干小型业务系统的PC Server服务器。

鉴于安全性和稳定性考虑,所有设备搬迁计划分4次完成,并且安排在业务相对空闲的时间段,比如周六晚上和周日白天。

机房的搬迁一般都会涉及到服务器、交换机、路由器、工作站等大量的设备,许多软件的问题以及新机房IP的分配问题等。因此如果提前不进行详细的规划,匆匆上马进行机房服务器等设备的搬迁,势必会造成工作的混乱。故在搬迁前,一个完整合理的机房搬迁规划是必需的。

2.1搬迁前的准备工作

(1)项目组内部讨论:成立项目组,讨论搬迁计划,确定搬迁时间、参与人员,确定各项任务开始的时间和所需的时间等。

(2)制作标签:在机房制作线缆标签和设备标签,并一一对应粘贴到位。

(3)新机房网络布线:①检查电源布线,包含应急发动机、UPS及每个机柜用电是否符合要求;②检查光纤布线,根据sanswitch表检查新机房光纤布线是否符合要求;③检查空调;④检查机房环境,根据机房环境标准来检查机房环境,如粉尘、清洁度、室内光源等条件是否符合要求。

(4)数据备份及恢复测试:为防止搬运过程中由于各种意外情况造成服务器或存储器损坏而影响到数据的可用性,应对某些关键性数据进行备份,如程序、数据库、各服务器的配置参数等。①PC Server数据备份,用ghost等软件对系统进行备份;②数据库数据备份;③其他应用备份,利用第三方软件对其应用进行相关备份;④备份策略的备份,用相关第三方软件对备份软件策略进行备份;⑤对某些操作系统进行备份恢复测试,根据测试环境对备份数据进行模拟恢复测试。

(5)确定搬迁路线:确认搬家公司的搬迁计划,包括行走路线。

(6)准备应急方案:在整个搬迁发生意外短时间内无法恢复时启动。

(7)项目组内部讨论:确定各项任务开始的具体时间和搬运过程中具体的人员负责,设备责任具体到人。

(8)发布公告:对外正式发布停机系统中断公告,联络医院各相关部门,做好应急预案,应对信息系统服务停机的情况。

2.2物理搬迁前的技术工作

(1)所有信息系统的应用服务和数据库停止运行。

(2)各系统关机,规定时间内将所有机器及网络设备全部关机。①PC SERVER关机;②小型机相关设备关机;③其他设备关机。

(3)搬运公司人员到场,并准备好包装材料和搬运工具。

(4)系统冷机,关机后等待30 min,确保机器在正常的温度下打包。

(5)拆除设备和电缆,由项目组相关人员拆卸所有服务器,并和物流人员配合将所有连线全部拆除。由于搬运的设备,如服务器、UPS、终端等都是集成度和精密度非常高的设备,因而在整个过程中,需要注意防止设备的碰撞。设备的拆卸主要包括:①PC SERVER设备拆卸;②小型机相关设备拆卸;③其他设备拆卸。

(6)对打包的设备进行编号并统计。

2.3物理搬运

(1)设备包装:由搬运公司将需要包装的设备按照打包运输相应规范进行打包。

(2)设备装车:设备搬运到车上,并进行固定。

(3)物理运输:由搬运公司将需要包装的设备按照打包运输相应规范进行运输。

(4)人员转移:所有技术及其他相关人员根据事先安排前往机房。

(5)机房设备卸货:设备运到后,搬运物流公司根据机房管理人员安排将设备运至指定的卸货平台。

(6)机房设备定位:①拆除包装:按照装箱单与实物进行逐一核对检查,确认设备上的各种零件、部件及有关标志正确、清晰、齐全。②设备定位:确定设备的放置位置,检查电源等相关事宜,将设备搬运至机房内指定位置,按照主机设备表来进行上架工作,根据网络端口进行尾纤的连接。

(7)设备交接:根据设备编号进行验货,并仔细观察设备外观是否损坏。

2.4安装及测试

(1)设备连接:包括机柜固定、设备上架、线缆连接等。机柜不能直接摆放在静电地板上,而要进行有效的固定。设备机架需要和底座或地面进行加固连接。机架加固底座的安装应在设备到货后由施工人员具体精确确定安装位置,同时根据设备安装设计图纸进行安装。其主要包括:①PC Server设备连接;②小型机相关设备连接;③其他设备连接。

(2)设备系统上电:各设备加电开机,启动所有的服务、数据库和系统应用。

(3)应用系统测试:搬迁后应用测试验证,由各系统维护人员进行软件测试。①服务器状态的恢复,查看是否出现了数据丢失或损坏的情况[6]。由于我们之前对系统数据作了备份,所以一旦出现了这种数据的损坏,就可以把搬迁前的数据重新恢复过来,以保证服务器的正常运行。②进行相应的IP地址、DNS设置、软件的调整和全网设备连通性的测试。③进行应用测试,确保系统的正常运行。④所有的设备重新启动,观察设备运行的速度和质量等指标是否达到标准。⑤进行相关的日志记录。

搬迁工作流程如图所示。

1.png

三、搬迁中的问题和解决方案

实践操作中仍然遇到了一些问题。通过努力,这些问题都得到了较好地解决,现列述如下。

3.1机柜留位

机房中每个机柜的位置在建造之初已经固定,支撑物为镂空的角钢支架,从防静电地板下方支撑到高于地板1 cm。由于以APC 42U机柜为标准,每个机柜只有60 cm的空间,2个机柜之间没有空隙。但是需要搬到新机房的数十个机柜中,有6个IBM的42U机柜尺寸略大,需要65 cm的留位。

3.2供电的稳定

搬迁后的新机房有专业电源控制机柜,包括相应的电池模块和控制模块,由专门人员负责操作维护。PACS搬迁时,IBM机柜到位,所有服务器上架安装完毕,系统工程师按标准流程顺次启动小型机和服务器,测试数据库和应用程序是否运行正常,测试时发现有1台服务器的电源灯闪烁(黄色),紧接着在排查供电错误时由于误操作导致整个机柜断电,小型机和数据库同时非正常强行关闭。

机房迁移是一项复杂而细致的工作,涉及到多部门互相协调、配合,在机房搬迁开始前制定周密计划、软件和硬件方面的完整准备工作是完成此项工作的关键。

原题:某医院信息系统机房设备搬迁方案

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论