同行分享:云管平台与运维平台应该统一建还是分开建?

2020-08-17 11:11:57
twt社区
网络运维
全文共约 2346 字,阅读约需 5~8 分钟。
公司规模大了,每个部门和人负责的事情更加细化,云管和运维平台是否放一起要看组织架构如何划分,我们的云平台和运维平台是独立的部门,所以只能分开。相互的配合和数据交互是问题,比如云管平台要从监控平台取所有虚拟机的性能数据,但是监控平台却只监控核心系统的数据。

云管平台与运维平台是应该统一建立还是分开建立好?如果分开建边界如何划分?

在企业没有成熟的云管平台和运维平台的情况下,企业应该选择方案一还是方案二?

方案一:分别建设云管平台和运维平台,然后对接。

方案二:选择一个云管平台,然后丰富其运维功能。

方案一的困难在于需要分别建设,需要划分边界;方案二的问题在于云管平台会越来越臃肿,演进方向不明。

问题来自@systemroot 中国航空结算有限责任公司 系统工程师,下文来自twt社区众多同行实践经验分享。

@木木糖 吉利汽车 基础架构经理:

我们的云管平台是资源生命周期管理平台,资源(虚拟机、物理机、DNS、VIP、负载均衡等)的生命周期,包括资源申请创建、回收和变更;运维平台有CMDB、堡垒机、ITSM、监控、日志等,云管平台和运维平台有数据交互,通过提供API接口实现。

公司规模不大,可以考虑云管和运维平台放一起,可方便统一管理。

公司规模大了,每个部门和人负责的事情更加细化,云管和运维平台是否放一起要看组织架构如何划分,我们的云平台和运维平台是独立的部门,所以只能分开。相互的配合和数据交互是问题,比如云管平台要从监控平台取所有虚拟机的性能数据,但是监控平台却只监控核心系统的数据。

所以要有顶层设计,定义好每个模块的功能,模块之前要交互哪些数据,如何交互,想清楚再做。

@lewoli qingcloud 系统架构师:

云管,顾名思义,云的管理,云的核心是云服务交付,所以云管的核心应该是多云环境的云服务的申请、审批、交付。从标准而言,应该是面对租户为主的。

运维平台,以资源管理为主,面对的是运维团队,关注的是系统的运行和管理。

所以,云管和运维是否合一,取决于其用户的分类,如云管的用户也是运维团队自己,则必然将两个管理系统合一,如果云管面对的是普通用户,即租户,那应该分开。

所以,还是根据场景来进行判断两个系统是否需要整合。

@mtming333 太平洋保险 系统运维工程师:

运维平台目前承担了发布工作流、生产发布打包,工单快速处理、告警配置 、脚本管理。除了工单做了意义不大,其他都应该糅合进云管平台与应用相关,成为应用生命周期管理的一部分。

从落实到使用者上,考虑到减少用户学习成本,我认为也是建立一套更好。

@summit 城商行 系统架构师:

首先要确认企业要建云管平台和运维平台的目标是什么?

1、云管平台主要实现资源的统一管理,统一交付,生命周期管理,流程管理等工作。

2、运维平台主要实现数据中心的资源监控、动环监控、监控实时告警等,并集成事件、问题、工单、CMDB等,并与ITSM结合实现流程线上化。

3、云管平台自带的监控主要监控自己管理的资源,监控的维度也不全面,比如中间件、数据库、硬件、动环的监控维度有可能不能涵盖,如果要实现全方位的监控需要做的工作很多,也会造成云管平台的臃肿。

4、可以分别建立两个平台,两个平台进行对接到统一的展示平台,实现统一管理。

总之,两个平台的功能实现不同,企业需要确认自己到底要实现什么功能和目标,来确定建设什么样的平台。

@duyh 中铁信 系统架构师:

在我们云管平台的建设中,由于云平台的建设和运维由不同的组负责,所以云平台的建设和运维平台的建设是分开的。这时候体现出来的优势就是分工明确,每个组的定位清晰,缺点是在云平台和运维平台交叉的一些问题上,不好定位,后来分析是由于两个组的配合问题,采取的解决办法就是一旦出现无法判断是哪个平台的问题的时候,就将两个组的人拉到一起共同解决。

而如果要把两个平台合到一起,运维平台统一管理所有资产,云管和运维平台耦合度太高,在运维平台有功能迭代时,由于云管平台依赖运维平台,不可避免的会影响云管平台的功能,代价太大,所以个人不建议将两个平台融合到一起。

当然,如果两个平台的体系架构不融合,只是从一个统一界面做单点登录,倒是也可以。

@he7yong Canway 研发工程师:

1. 是分是合?从业务现状,业务目标,业务需求出发,没有最好,只有最合适;最佳实践是:平台不要太多,如果太多,平台之间又会形成竖井,功能的打通和数据的打通会面临问题。

2.我推荐的方案如下:选择一个统一的运维平台(具备较强的集成能力和二次开发的能力),云管能力,CMDB能力,监控能力,事件处理能力,大数据分析能力,运维流程能力,甚至代码管理能力,测试能力,构建能力,制品库管理能力,都可以作为通用能力模块集成到“统一运维平台”。

3.面向用户的资源交付服务,云平台管理服务,运维服务,流程服务,工单服务都可以运用场景的理念,快速开发实现。

@Henry2017 金融行业 研发工程师:

云管和运维是强耦合的,推荐放在一起做。

给不同用户配置不同角色权限,普通用户只能看到云资源操作的视图,管理员能看到全平台的视图,包括监控,日志,集群状态等。

@jason2006xu 昆仑银行 技术经理:

1,从总体架构规划和设计原则来讲,系统间应该遵循高内聚、低耦合的原则,所以云管平台和运维平台应该分开建设,如果已经整合在一起的话,建议按功能模块分离,降低耦合度。

2、两个平台基本功能和定位不同,云管平台的功能包括IAAS云平台管理、PAAS云平台管理,其中IAAS管理包括存储、网络、计算资源管理,PAAS云平台管理主要包括容器云管理;运维平台包括监控、ITIL、CMDB以及自动化等。

3、云管平台可以通过ESB与ITIL、CMDB、自动化进行报文交互及集成。

所以,建议选择方案一。

@asdf-asdf cloudstone 研究学者:

云管模块负责资源交付和基础数据提供,自动化运维模块负责持续运维,版本发布都是后期自动化平台的工作,最后资源回收是云平台模块操作。分开开发可实现快速业务上线。

收藏
免责声明:凡注明为其它来源的信息均转自其它平台,由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。联系邮箱:leixiao@infoobs.com