大模型的云端构想,云厂商的必争风口

旸谷
今年以来,大模型引爆科技圈,热度始终高涨不下。英伟达狂飙的股价与利润体现了以GPU为代表的芯片市场的火爆,而作为AI基础设施之一的云,此前似乎被遮掩了些许光芒。

本文来自微信公众号“物联传媒”,作者/旸谷。

今年以来,大模型引爆科技圈,热度始终高涨不下。英伟达狂飙的股价与利润体现了以GPU为代表的芯片市场的火爆,而作为AI基础设施之一的云,此前似乎被遮掩了些许光芒。

此前,大模型对云的影响称不上显著。但随着微软、谷歌、亚马逊相继披露季度财报,直观的增长摆在眼前。因而,多家云服务商都调高了业务期待,预计影响将逐渐从2023年第四季度起体现。

从头部云厂商的业绩来看,在生成式AI的驱动下,以Azure为核心的微软智能云收入同比增长了13%至565亿美元,净利润同比增长了27%,至222亿美元,微软表示,主要得益于对消费者和商业产品中大型AI模型的不断增长需求,推动了云消费的增加;AWS的收入结束了此前连续六个季度的放缓,并预计生成式AI会在未来几年带来数百亿美元的收入。市场占有率排在微软与AWS之后的谷歌,由于云收入低于预期,股价一度大跌9%。

此外,近期的Open AI开发者大会上,Open AI宣布将围绕GPT打造AI平台,推出GPT Store,让用户用自己的自然语言来创建自己的“个人版ChatGPT。大模型从通用走向垂直,从B端走向C端,其创新不辍,逐渐走向普惠性发展的同时也意味着云厂商将面临着又一轮的增长机遇。

可以说,AI的下一个拐点,“云关”已至。

大模型如何“需要云”?

今天的大模型并非依靠一个计算单元,而是需要将成千上万个计算单元联合起来,组成复杂的分布式系统。

训练大模型所需要的超大规模的数据处理和并行计算能力,必须通过对对网络操作系统、分布式计算引擎、网络设备、交换机、计算架构等全栈内容的整体优化来实现。可以说,在云的支撑下,大模型才能完成“数据中心级”的重构。

以微软为例,为了支持OpenAI训练ChatGPT,专门设计了一台10000张A100芯片连接起来的超级计算机,在获得高效能算力的同时,也要解决数据中心的散热、断电等工程问题的优化。可以说,正是有了微软的云服务支撑,才造就了如今的ChatGPT。

正如阿里云CTO周靖人所言,此轮AI技术变革的本质,其背后是整个计算机体系的全面升级。云计算灵活、可扩展的弹性调度能力,成为大模型训练、推理部署的必要基础设施。而大模型则为云计算激发了更多资源需求的同时,带来技术架构和产品布局的革新,由此激发出更多业务场景,成为当前云计算市场不可多得的兴奋剂。

广袤市场如何“布局云”?

英伟达曾透露,2023财年数据中心业务有40%的收入来自超大规模数据中心与云服务商。

随着大模型逐渐走向轻量化和应用场景的拓展,未来大模型将成为一项通用服务,带来真正的AI普惠性发展。作为基础设施的云计算将会在大模型的驱动下进一步重塑产业格局。

根据Gartner统计,2022年全球云计算市场规模为4910亿美元,增速19%,预计在大模型、算力等需求刺激下,市场仍将保持稳定增长,到2026年全球云计算市场将突破万亿美元。

当前,云计算市场也已涌现出许多新业态

算力调度:

AI大模型的兴起加速了对更大规模和更强大计算资源的需求,这也使云计算服务提供商继续改进其硬件和软件基础设施,以支持大规模AI训练和推理工作负载。又因硬件设备的成本过高,近来算力调度、算力租赁模式火热。

前者以合作形式共建算力生态。以青云科技为例,其推出的AI算力调度平台,介于底层的资源层与上层的模型层之间,通过整合不同来源、类型和架构的算力资源,实现统一调度与运营,为用户提供按需获取和调度的服务。当前已经成功服务于国家超算济南中心。当青云科技的客户有算力需求,青云科技可以通过直接调度济南超算的算力向客户提供AI算力资源。因此,青云科技既是济南超算的供应商,也是其渠道商。

而后者算力租赁模式除了有传统的云计算服务提供商和第三方数据中心企业参与,还吸引了如莲花健康、恒润股份等企业跨界入局,致使相关概念股大涨,部分公司几度涨停。在投资者提问平台,可以搜索到近600条关于算力租赁的提问。

云智一体:

过去,云计算更专注于算力能力,服务模型集中在IaaS、PaaS、SaaS三层。如今,云计算在大模型驱动下具备了更强的集成能力,可在算力、算法和应用层中嵌入大模型,进而强化云计算的“智”,以智能底座集成应用并统一对外输出,实现场景端的生产力解放,同时进一步降低企业获取和使用人工智能的门槛。目前,百度、阿里乃至更多云计算企业,已经将目光投向“云智一体”,布局在智能基础设施之上的通用型AI产品能力。

云原生安全:

在由AI大模型的兴起带来持续算力的需求同时,安全保护也成为新业态下的重点挑战。

作为新兴市场,云原生安全为技术创新型公司提供了更多发展机遇,云计算厂商以及专业网络安全厂商都在加速布局,力争获取先发优势,并通过融入机器学习、人工智能等技术为最终用户提供更智能化、自动化的容器安全解决方案。

头部厂商如何“角逐云”?

当前,随着大模型落地路径的日趋清晰,大模型也成为国内云服务商未来十年甚至二十年的核心战略。未来MaaS将成为云计算的主流商业模式,各类应用将基于大模型来开发,每个行业需要打造行业自己的大模型。基于此,头部厂商纷纷拿出创新方案——

阿里云:

基于对行业模型落地的认可,阿里云提出开源通过从底层算力(IaaS)到AI平台(PaaS)再到模型服务(MaaS)的全栈技术创新,升级云计算体系。

在此前的云栖大会上,阿里云针对大模型升级了AI基础设施,提供更高性能、更低成本的智能算力。全新升级的阿里云人工智能平台PAI,底层采用HPN 7.0新一代AI集群网络架构,高效协同调度各类芯片,可支持高达10万卡量级的集群可扩展规模,让超大集群像一台计算机般高效运转。

京东云:

基于企业自建产业大模型的风潮指向,京东云推出混合多云操作系统“云舰”和数据储存体系“云海”以多云资源提供给业务方,向行业云、产业云的方向演进。这种多云混合部署形式一方面大大降低投入成本和能耗支出,同时保障企业自身数据安全,另一方面可规避企业用户与单一云厂商深度绑定,一定程度上保障企业议价权。

腾讯云:

基于过去积累的庞大业务数据和算力基础设施,腾讯云已经推出了自己的MaaS大模型精选商店,将基础资源、技术支持、工具组件等进行整合。企业可以基于腾讯云TI平台,然后结合自身的应用场景,按需定制或者构建自己的专属大模型。

目前,腾讯云行业大模型能力已在腾讯企点、腾讯会议、腾讯云AI代码助手等多款产品中落地使用;通过联合行业头部企业,已为文旅、政务、金融等10余个行业,提供了50多个大模型行业解决方案。

百度云:

百度智能云在去年构建的AI大底座,通过集成百度智能云在AI IaaS层和AI PaaS层的先进技术,极大降低了AI产业应用的门槛。同时,为推动中小企业上云,百度推出“千帆AI原生应用开发工作台”,为大模型的研发、服务提供了全生命周期的支持。

华为云:

基于已有的行业伙伴生态和自家盘古大模型的行业应用实践,华为云继续专注To B的行业市场,高效带动其他生态伙伴参与到大模型升级中。据华为云官方数据,目前,华为云AI已在各行业落地了1000+项目。

写在最后

大模型时代竞争日益激烈,云底座的效能也愈发显著,这便注定了云生态会持续变化发展,未来云计算平台厂商也将从从载舟者成为划桨者,共同构建出大模型时代的数字化生态,基于多元需求带来更多创新和智能化的解决方案。

参考资料:

1.产业科技.大模型时代,MaaS重塑云计算服务范式

2.甲子光年.开源与开放,阿里云的大模型解法

3.21世纪经济报道.大模型时代的云计算:云原生、云中立与网络安全同样重要

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论