大模型加剧算力多元化之争,断代式、可进化,你选择谁?

在算力多元化的背景下,云基础架构的升级是断代式的,还是依托一个可持续进化的、一劳永逸的云平台,不言自明。当今时代,在市场不确定性不断增加的情况下,可进化的云平台其实是为用户提供了一个确定性的选择。

本文来自微信公众号“云数智观察”,作者/涛哥。

科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,我国已经发布了79个参数规模超过10亿的大模型,“百模大战”一触即发。大模型不仅带来了新场景、新业态,而且对算力提出了极高的要求,不仅要快,更要多样化。为AI训练、AI推理、数值模拟等不同应用提供不同的算力,实现多种计算类型的全覆盖已是大势所趋。

其实,大模型风暴只是算力革命的“冰山一角”。随着企业数字化转型逐步深入,以及云原生应用的快速兴起,应用场景的多样化直接推动了算力多元化不断加剧升级,从虚拟化、云主机、裸金属到容器再到Serverless……云基础架构的升级换代面临前所未有的挑战。

你是继续容忍断代式升级的方式,还是直接拥抱可进化的模式,这个问题变得像哈姆雷特喊出的“生存还是毁灭”一样严峻和值得深思熟虑。

兼顾历史,面向未来

回顾IT基础架构的演进,从上个世纪90年代开始的硬件单体架构的彻底拆分,到之后x86架构的虚拟化,再到云计算,在云原生之前,云上的算力基本比较单一。而在这之后,随着以容器、Kubernetes等为代表的云原生的快速崛起,就像是为算力打开了一泻千里的闸门,多元化、新兴的算力层出不穷,金属裸机、虚机、容器、Serverless、FaaS、大模型等算力并存、交织、共同演进。

1.png

算力发展的多元化主要表现为由计算场景多元化激发的算力需求多样化、算力来源多样化、算力品牌多样化……由于质的飞跃,在公有云上支持多元化算力可以说是水到渠成,不费吹灰之力。然而对于演进速度相对较慢的私有云来说,算力多元化却还是横亘在很多用户面前的一道高门槛,平滑升级就是第一个难关。

举例来说,以前我们在PC机上用的网银,它就是基于微服务架构开发的,而现在更多的人选择手机银行,这意味着应用架构要重新写。如果给你一个选择,在原来的微服务架构基础上修修补补,或是干脆采用全新的云原生架构进行开发,你会怎么选择?虽然心知肚明,云原生是最理想的方式,但可能很多人还是会犹豫。为什么?

历史的包袱真的想甩就能轻松甩掉吗?传统上,IT基础架构的构建方式就是自上而下,根据应用的需求匹配相应的计算、存储、网络等资源,这样在特定时间点、特定应用需求下打造的架构或系统,注定是资源与应用紧紧绑定的一个个“孤岛”。

孤岛是现实存在,只要传统的系统构建、部署和应用方式不变,孤岛就会一直延续,而且会越积越多,直到积重难返。以前,在工作负载的种类、数量都相对较少的情况下,这种应用与系统“1对1”的构建方式还能比较快地满足用户上线新应用的需求,但随着工作负载越来越多,应用上线的窗口期越来越短,用户的资源供给能力和人力就会频繁出现缺口。而且面对一个个的孤岛,管理和统一操作也变得十分复杂,提升效率和降低成本都成了麻烦事。按照传统方式,系统的扩展表面看上去会比较简单,就是一个系统一个系统简单地叠加。但是到后期,系统数量变成不可承受之重时,再想从底层架构改起,难度可想而知,阵痛也会更强烈。

对于很多用户来说,系统的扩展升级从来都不是一件易事。历史上,每一次技术架构的变迁都是一次“割接”,相当于推倒重来,包括从单体架构到分布式、从分布式到微服务、从ON CLOUD到IN CLOUD的转变,无一例外。这对于用户业务的发展将产业重大的影响,必须妥善处置。

从大型机到x86的割接式改变,就是我们所说的断代式的升级,但这毕竟是硬件上的一次“改头换面”,断代式升级虽是无奈之举,但似乎也没有其他更好的办法。然而之后的从虚拟化到云再到云原生的升级,硬件已经“统一”,软件也有了可进化的持续平滑升级的可能性,如果再采用断代式升级的方法,无异于走“回头路”。

在算力多元化的背景下,云基础架构的升级是断代式的,还是依托一个可持续进化的、一劳永逸的云平台,不言自明。当今时代,在市场不确定性不断增加的情况下,可进化的云平台其实是为用户提供了一个确定性的选择。你或许不知道未来新技术会如何变化,算力还会有多少“花样”,“兼顾历史、面向未来”的可进化云平台都能让你泰然处之、持续前进。

统一平台+均衡性设计

无论是老牌的虚拟化厂商VMware,还是新晋的私有云专家EasyStack,在云原生可进化这件事上思路不谋而合,先建立云原生的底座,然后在上面不断增加服务。为满足算力多元化的需求,云计算基础架构在用户层面,要能实现应用、管理与运维的统一,在产品层面,则要实现功能、场景和品控的统一,更重要的是,实现开发、测试、迭代升级的统一。

并不是每个厂商都能轻松满足上述“三大统一”的要求。很多厂商只能单摆浮搁地为不同的场景提供相对应的算力平台,却不具备均衡性架构设计的能力,导致在可进化这个最核心的问题上会打折扣,或根本无法实现。

1.png

以EasyStack为例,它在提出可进化的数字化基础设施之前,也曾经历过纠结挣扎、不断的试错,以及持续的演进。在如今的可进化架构成型之前,仅大的核心级的升级EasyStack就有过4次。从硬件到虚拟化到容器,这是一个渐进的过程。EasyStack的平台在V4、V5版时,最初只支持虚拟化,现在不仅CPU、GPU、NPU等全覆盖,而且还提供封装接口,从而更好地支持其上的各项云服务。更重要的是,在这个演进的过程中,EasyStack持续将开源技术的能力,通过工程化的方式,源源不断地输入和集成到现有的商用平台上,为多元算力提供稳定、可靠、安全的支撑。

EasyStack新一代可进化的云平台,不仅可以同时支持裸金属、云主机、Kubernetes容器集群以及多种容器的运行,而且可以提供与不同算力相适合的容量型或高性能的云存储、统一的多VPC SDN网络,以及统一的监控、日志和运维服务等。此即架构的均衡性设计,就是在基础架构层面,计算、存储、监控、网络、安全等各种能力不仅要全,更要均衡匹配,还要彼此打通,不会有“短板”,并且可以按需组合、随需应变,满足当前和未来扩展的需要。可以想见,针对单独一种算力实现架构的均衡性设计已经很难,在算力多元化的情况下,工作量和复杂程度将是呈几何级数增加的。

针对多元算力,EasyStack新一代可进化云平台之所以能够信手拈来,关键还在于其平台与云服务的分离式设计。轻量级的统一的数字原生引擎EOS,与多样化的云服务相结合,能够灵活满足从中小规模到超大规模云的私有化部署所需,无论是虚拟化、裸金属算力,还是云原生、AI算力需求,都能无缝扩展响应,且无需采购多套平台、多套软件。

如今,“一云多芯”成了信创云的一个基本特征。而一云多芯本身就是算力多元化的一个典型。顾名思义,一云多芯就是基于一朵统一的云,同时支撑不同架构的芯片。将这种“1对多”的模式推而广之,“1”就代表一个可进化的平台、云原生底座,而“多”代表多元化的算力。EasyStack要努力打造的就是这“1”个可进化的平台。

1.png

可进化起步就是“全屋智能”

打比方来说,断代式的升级就好像是人们对房屋进行装修时,从毛坯房到精装修的过程;而渐进式的升级,则像是在基本装修的基础之上,不断增加一些带有智能化功能的家居设备,只不过在增加的过程中,可能会受限于原有房屋的装修风格,对比IT系统的演进,就是IT基础架构不变,只是在上面“零打碎敲”;而可进化的升级方式,起步就是全屋智能,无论未来再有任何新的变化,都能轻松融入整体氛围和功能,实现智能化的不断升级。

经过上述对比,你可能会更清楚,在什么情况下,选择何种升级方式才是最适合、最明智的。可进化的架构所要作的就是弥补现代化应用与IT基础架构发展不同步所产生的Gap。对于基础架构平台厂商来说,支撑可进化,只拥有单一的技术强项是不行的,必须首先解决资源要素“全”的问题,既要有完整的技术堆栈,又能实现均衡设计,同时还要保持开放性,实现基础架构的完全解耦,这样才能保持基础架构不断向前演进,而且具有先进性。

每当有新的技术、新的需求出现,在架构和平台不改变的情况,就能轻松支持、纳管,这就是可进化架构的核心价值所在。作为云操作系统厂商,EasyStack以纯软件定义的方案,提供统一的一套API,基于“小内核+多组件”的理念和架构,实现了所有场景可编程、可灵活组合,充分诠释了什么才是云平台的可进化。EasyStack从始至终都专注于基础设施,也就是基础设施平台及其相关联的基础能力,包括多元化的算力,以及云存储、云网络、API、安全、操作系统、自动化能力等。

针对中国企业客户而言,新型算力不断增加是常态,稳态业务与敏态业务长期共存是现实需求,只有可进化的架构,才能有效应对多元化算力的爆发。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论