数据中心网络运维

数据中心网络运维涵盖了除业务发放之外的网络安装部署、故障定位、质量监控、升级扩容等。数据中心的运维的核心问题是在成本、效率和质量三者之间取得平衡,并沿着标准化->自动化->智能化的方向演进,最终达到是自动化、可视化和智能化的总体运维目标。

云计算数据中心的网络运维包括两个方面,即数据中心网络管理员运维和租户网络管理员运维两个不同的视角。数据中心网络运维包括从安装部署、业务发放、故障定界定位、状态监控到网络变更的整个生命周期。不同的运维视角有不同的运维要求,但简单、高效、开放、可视的数据中心网络,是运维对于数据中心网络的基本要求。

2345截图20201119114036.png

网络运维要求

数据中心网络运维涵盖了除业务发放之外的网络安装部署、故障定位、质量监控、升级扩容等。数据中心的运维的核心问题是在成本、效率和质量三者之间取得平衡,并沿着标准化->自动化->智能化的方向演进,最终达到是自动化、可视化和智能化的总体运维目标。

自动化

运维自动化主要解决网络业务配置量大、上线周期长的问题,主要包括:

设备零配置开局:提供设备自动安装部署功能,加快设备部署效率;通过批量扫描、纳管设备,压缩业务布放准备时间。

网络服务自动化:包括二三层网络配置的自动化下发和四层-七层增值业务的自动化对接和配置。

设备替换自动配置:备件替换时,设备配置自动化下发。

配置一致性检查:包括SDN控制器北向与云计算管理平台、南向与设备的配置一致性检查。

可视化

运维可视化主要解决网络故障定界和定位困难的问题,主要包括:

网络和计算资源可视:包括整网资源、逻辑网络资源、设备资源、计算节点位置信息等可视化。

网络拓扑可视:包括应用网络拓扑可视、逻辑网络拓扑可视和物理网络拓扑可视,以及上述三层网络拓扑的互视。

业务路径可视:包括业务实际转发路径的呈现、VTEP间的ECMP多路径探测、业务连通性检测(MAC/IP Ping、IP Trace)、网络边缘的环路检测。

智能化

运维智能化是运维发展方向,主要包括:

环路检测:智能检测网络中的环路,降低环路对业务网络造成的影响。

服务质量检测:网络业务质量随流可视,智能计算网络服务质量。

大数据运维:智能网流分析系统通过对网络流量进行数据采集和大数据分析,实现流量趋势预测、网络故障自愈、网络性能调优等功能。

智能化的网络运维也对可视化和自动化提出了更高的要求,主要包括:

1)可视化:看得见、看得清

“看得见”包含两个含义:观察的对象、观察的实时性。观察的对象不仅要支持观察物理设备、接口、链路等物理对象,同时还要支持观察报文转发路径、业务交互关系和质量等逻辑对象;观察的实时性则是要支持对毫秒级现象的感知,如识别网络中的微突发流量拥塞现象。而“看得清”则意味着针对观察的准确性,一方面需要采集海量数据,另一方面针对这些海量数据进行实时分析,识别异常的业务流。

2)自动化排障:主动分析、自动排障

运维系统应能及时、主动、智能地发现网络中存在的故障,就需要能自主地对海量数据进行分析,识别出网络中的异常事件,例如识别出业务连通性问题、流量拥塞端口等。并结合机器学习算法,决策是否生成故障模型推荐给用户。对于自动化排障,则要求运维系统能基于故障数据的分析、以及对故障案例库的自学习,根据不同的故障模式编排出用户可执行的排障任务链,从而将故障定位定界时长从天级、小时级降低到分钟级。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论