中小银行云原生架构的演进趋势解读分析

胡海光
云原生技术的进一步发展壮大和逐渐成熟,为研发效率、运维效率及资源效率等提升带来了可行性解决方案。而国产信创替换步伐进一步加快,带来的云原生应用复杂度和规模也在不断提升。

本文来自微信公众号“twt企业IT社区(talkwithtrend.com)”,【作者】胡海光,某农商银行架构师,主要从事系统、数据库、分布式存储、虚拟化及云平台等运维管理工作。

【摘要】云原生技术的进一步发展壮大和逐渐成熟,为研发效率、运维效率及资源效率等提升带来了可行性解决方案。而国产信创替换步伐进一步加快,带来的云原生应用复杂度和规模也在不断提升。传统“将应用迁移到云”的思维模式逐渐被“以云为中心设计应用”的云原生理念取代,因此云原生架构演进和运维转型已成未来趋势。基于此背景下对云原生相关技术的探索和研究更显重要,本文结合某行内打造的新一代云原生平台的建设思路和方案,给出平台的后续演进路径,更好地为业务的安全、高效、稳定和敏捷运行保驾护航。希望本文能为同行提供参考。

前言

随着云计算技术的迅猛发展和日趋成熟,特别是容器技术的深入推进和快速迭代,使得云原生技术在近些年来逐渐崭露头角,也在各行业各场景中生根发芽。而在数字化转型和国产化信创等政策的指引和推动下,云原生技术进一步发展壮大,带来研发效能、运维模式、部署架构等一系列变革,为研发效率、运维效率及资源效率等提升带来了丰富的可行性解决方案,也成为核心业务系统等重要系统国产替换的可选方案。

云原生技术发展至今,企业数字化转型已进入”深水区”,国产信创替换步伐进一步加快,云原生应用的复杂度和规模也在不断提升。传统“将应用迁移到云”的思维模式逐渐被“以云为中心设计应用”的云原生理念取代。这种转变不仅是技术架构的升级,更是软件开发方法论、组织文化和商业模式的系统性变革,因此云原生架构演进和运维转型已成未来趋势。截止目前云原生架构已从早期的探索阶段转变为支撑企业级应用的核心基础设施,其技术栈呈现智能化、泛在化、生态化三大趋势。本文基于行内云原生架构和运维模式的升级演进为例进行分析说明。

云原生架构和运维模式的升级演进

行内从成立之初发展至今,经历了大概四次大的技术架构变革,整体的演进过程如图1所示。

从最初的靠人手工记账开始到迈向电子化,业务大都部署在小机上,体量较小,电子化程度不高,应用架构较为单一化。

随着行内业务的大上收和电子化的普及,单一化的架构已无法满足业务的需求,因此以云计算基础平台为支撑,将数据库和应用业务分离部署,并开始使用传统虚拟化和积极探索云计算技术。

随着网络金融的发展和业务的不断增长,对系统的扩展性和业务连续性提出了更高的要求,因此行内开始进行架构升级,从简单的虚拟化转向分布式架构,实现了业务的弹性扩容和同城双活。

随着行内业务的持续增长和面客场景的拓展,在人员规模、系统复杂度及并发度等方面呈现出大幅度增长,导致研发效能、资源效能、用户体验、运维管理和高可用等方面的问题日显突出,而云原生技术的发展和成熟为这些问题的解决提供了可选方案。行内在国产信创和核心下移的背景下进行云原生架构改造升级,使得业务整体关注度充分上移;同时在风险防控、安全把控和故障应急等基础技术能力逐渐模块化和标准化,研发效能和业务敏捷度大幅提升。

微信图片_20250430141016.png

图1行内系统架构演进

随着云原生架构在多个局点的实际落地,过程中也暴露出不少问题,主要表现在成本、安全、复杂性和管理等几个维度方面:

1.成本控制方面:云原生架构按需分配和业务多活的特性容易导致资源过度分配和闲置,特别是多站点重复部署和未及时释放的闲置资源;

2.安全合规方面:在云原生架构下数据的传输、存储及处理方式发生了变化,变化引发的应对措施是否满足监管标准是行内面临的首要挑战,同时微服务化和动态扩容特性进一步增加数据被攻击和泄露风险,同时各云服务厂商各自不同的合规标准差异进一步增加安全管理难度;

3.系统复杂性方面:云原生架构采用微服务和容器等技术,使得系统组件数量剧增,服务调度和链路交互次数激增,跨服务链路追踪困难;同时容器服务自动扩缩容导致拓扑结构变化频繁,传统监控工具实时捕捉状态较为困难;

4.组织和管理方面:云原生架构涉及行内多个层面,含基础设施、应用架构、网络架构、安全架构、业务架构等,在演进的过程中需各层面协同推进、聚力而行;然而还是出现了各自为政、协调困难等问题。同时行内管理制度和方式(如运维管理、网络管理和安全管理等)也无法满足新架构带来的变革,导致管理上的技术空白。

基于云原生架构的特性结合存在的问题,行内充分考量和详细论证,提出屏蔽基础设施差异、多种技术形态的兼容,平台功能对准应用需求,自身架构灵活安全、分级解耦,具备平台容灾的建设思路,设计原则基本如下:

1.服务应用方面:平台能力建设对准应用需求。平台对应用开发、测试、生产等场景进行支持,为应用提供运行、日志、监控等标准化能力,并支持单元化应用架构;

2.灵活安全方面:可灵活调配集群数量、集群规模、业务规模,实现平台随业务动态伸缩;同时充分考虑平台在操作、审计、网络等方面的安全性;

3.分级解耦方面:平台管理面和业务面故障隔离;业务面内管理节点与业务节点解耦;实现管理面-管理节点-业务节点分级解耦;

4.平台容灾方面:管理平台自身可以通过数据同步和域名切换实现容灾架构,保障管理连续性;实现平台分钟级RTO、秒级RPO;

5.多态兼容方面:支持多种CPU架构、基础设施、操作系统,实现资源统一调度和屏蔽底层依赖和差异。基于以上设计原则,行内以云原生平台架构为原型开发建设,利用多集群管理、应用管理、应用运维、基础设施管理等能力作为集成平台能力,围绕原生应用、微服务应用和单元化应用提供云原生能力支撑。具体的云原生平台架构如图2所示。

微信图片_20250430141022.png

图2行内云原生平台架构图

云原生平台基于以上思路和架构完成整体建设后,将进一步演进为PaaS平台,从云原生平台能力基础上建设PaaS平台核心能力,为行内应用开发提供公共技术组件服务、设计开发服务、单元化运行环境、资源统一供给、平台统一运维管理,并利用PaaS平台形成技术资产统一的技术标准、运营标准和服务标准,并通过门户的形式形成服务目录和资源目录提供用户使用,其后续演进路径如图3所示。

微信图片_20250430141023.png

图3云原生平台后续演进路径

同时云原生运维架构的核心目标已从资源管控转向业务连续性保障,其演进趋势呈现全域观测、主动防御、人机协同三大特征,具体体现在技术栈的革新方面大致如下:

1.可观测性体系方面:传统监控逐渐升级为全链路可观测性监控,通过日志、指标、追踪数据的深度融合并结合AI技术构建数字化、智能化及标准化运维视图;

2.自动化运维方面:运维自动化从流程驱动进一步演化为策略驱动,有效提升运维效率,推动运维从被动执行向主动决策的进化;

3.安全运维一体化方面:安全能力将进一步深度嵌入运维流程,打造DevSecOps闭环,通过零信任架构实践、策略即代码、实时威胁检测等手段进一步强化安全赋能;

4.边缘协同运维方面:边缘计算能力与云原生运维将进一步深度融合,解决“最后一公里”难题,打造边云协同调度,实现离线自治能力。

结语

以上以系统架构历史和演进为轴,对云原生架构进行了溯源,并基于行内现有业务背景和痛点,以行内打造的云原生架构为例进行分析说明,同时也指出了后续的演进路径,对云原生运维技术栈演进等进行了详细介绍。通过构建云原生分布式架构,完成了从单元化到云原生架构的升级演进,实现技术平台和基础设施解耦,屏蔽不同基础设施对应用和技术平台的差异,避免单一云厂商依赖,为应用提供统一和标准化的部署运行环境,同时提供高性能、高可用、故障自愈、弹性伸缩、标准化部署、高效资源供给等云原生能力。为业务的发展提供安全、高效、稳定和敏捷的基础能力,达成应用运维效率、平台管理与使用效率、基础设施敏捷性总体提升的美好愿景。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论