对企业来说很难维护定制软件。创建工具只是支持过程的开始,只要软件一直在为企业服务,那么这个过程就会持续下去。一般的修修补补就要比开发最初的版本付出更多的工作。
运维人员对公司互联网所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障。多数据中心接入提高业务的容灾能力,通过监控、日志分析等技术手段,及时发现和响应服务故障,减少服务中断的时间,使公司的互联网业务符合预期的可用性要求,持续稳定地为用户提供服务。
由于超大规模数据中心运营商和云计算提供商以及大型企业为了有效应对冠状病毒疫情的影响,需要开展更多的计算工作,服务器销售量现在一直保持在20多年前网络繁荣时期的水平。
企业将IT部门的职责(IT桌面运维、服务器和网络设备的维护工作,以及IT环境建设、)全部或部分外包给专业的第三方IT外包服务公司来进行管理,集中精力发展企业的核心业务。
定位故障原因,最常用的方法就是分析应用日志,对运维人员不仅需要知道业务功能对应哪个服务进程,还要知道这个服务进程对应的哪些应用日志,并具备一些简单的应用日志异常错误的判断能力。
所谓自动化运维是指通过将日常IT运维中大量的重复性工作(小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度)由过去的手工执行转为标准化、流程化和自动化操作。