本文来自微信公众号“半导体行业观察”,编译自semiwiki。
数据中心通常被认为是CPU(x86、ARM、RISC-V)和GPU(NVIDIA、AMD、定制ASIC)之间的较量。但在这些备受瞩目的竞争背后,另一场静悄悄的革命正在上演:ARM悄然取代了英特尔和AMD在数据处理单元(DPU)市场的份额。
DPU(也称为SmartNIC)负责数据中心的“管道”。它们通过管理数据包处理、TCP/IP和RDMA来减轻网络负载。它们处理压缩、加密和NVMe-over-Fabrics(NVMe-oF)等存储服务。它们强制执行安全隔离,这在多租户云环境中至关重要,因为信任边界会不断受到考验。此外,它们还负责执行编排任务,否则这些任务会浪费宝贵的CPU周期。
NVIDIA(通过Mellanox开发的BlueField)、Marvell(OCTEON)、AMD(Pensando)和Broadcom均在其DPU中采用了ARM内核。原因很简单:ARM内核体积小、功耗低、可授权,并且已经嵌入到网络芯片中。当英特尔推出其基础设施处理单元(IPU)计划时,ARM已经占领了整个生态系统并制定了标准。
市场背景:为什么是现在?
全球数据处理单元(DPU)市场预计将从2023年的15亿美元增长到2032年的约98亿美元,复合年增长率(CAGR)高达22.8%(Dataintelo Consulting Pvt.Ltd.,2024年)。Dataintelo将这一增长归因于数据生成的迅猛增长以及各行各业对高效数据管理和处理解决方案的需求。目前,ARM内核占据了DPU出货量的绝大部分,而英特尔仍在持续推广其IPU,但尚未获得广泛的市场吸引力。
与此同时,RISC-V在邻近领域已势头强劲。来自首尔的Fadu等公司的存储控制器(该公司将RISC-V内核集成到其企业级SSD控制器中,用于I/O调度和延迟优化)以及SiFive都使用RISC-V来加速I/O。编排和安全处理器也经常依赖于轻量级RISC-V设计,例如OpenTitan。这些与DPU的角色天然相关。同时,地缘政治因素也有利于多元化:尤其是中国正在加速自主采用RISC-V,而DPU正是那种主权至关重要的基础设施组件。
市场扩张、ARM的锁定以及超大规模者对架构替代方案的渴望为RISC-V进入DPU奠定了基础。
RISC-V在DPU中的机会
与ARM不同,RISC-V提供开放式ISA,企业可以根据其具体工作负载进行定制。(Wevolver,RISC-V vs.ARM,2023年)。这对于集成了各种功能模块的DPU尤其重要:用于数据包流的网络引擎、用于压缩和NVMe-oF的存储加速器、用于隔离的安全模块以及用于编排的控制平面CPU。RISC-V允许供应商使用自定义指令来适应这些角色,而无需依赖ARM的固定路线图。
如今的DPU通常使用ARM Cortex-A内核集群(范围从Cortex-A53到A72)(Marvell,OCTEON 10技术白皮书,2023年)来处理控制平面和轻量级计算功能。RISC-V在这方面具有以下优势:–定制化:供应商可以根据特定工作负载调整指令集,而无需依赖ARM的固定路线图。
一些RISC-V供应商(例如Akeana)支持每核最多四线程的同步多线程(SMT)(Electronics360,2024),从而提高了高内存或I/O延迟工作负载(例如网络和数据包处理)的吞吐量和利用率。最新的RISC-V矢量扩展可以自然地映射到数据包处理、加密和存储加速。
新兴的矩阵扩展将可编程性扩展到AI推理和安全领域。初创公司Simplex Micro的架构在一个时间调度框架内集成了标量、矢量和矩阵执行,利用RISC-V的可扩展性,在各种AI和HPC工作负载中提供确定性的性能。最后,RISC-V避免了ARM的专利费,同时保持了与Linux、TensorFlow和PyTorch等开源堆栈的兼容性。
了解RISC-V的标量到矩阵路线图
这一刻之所以引人注目,不仅仅是因为又一家IP供应商的宣传,更在于RISC-V本身的发展方式。该ISA最初致力于标量计算——为微控制器、嵌入式系统和支持Linux的简单处理器提供小型、高效的内核。在过去几年中,RISC-V稳步增加了矢量扩展,实现了数据并行加速,并自然地映射到网络、存储和加密工作负载上。最近,其路线图已扩展到包含矩阵扩展,旨在将AI推理和其他矩阵数学密集型任务纳入同一ISA框架。
这种从标量到矢量再到矩阵的演进,反映了DPU的性能要求。DPU必须处理标量控制平面逻辑、可矢量化的数据包和加密流,以及日益面向矩阵的遥测和安全推理任务。换句话说,RISC-V路线图为真正可编程的DPU提供了完整的要素集。
问题不仅仅在于RISC-V能否取代ARM,还在于它能否扩展DPU的定义本身。ARM目前在DPU领域的主导地位依赖于标量核心加上固定加速器。RISC-V通过将标量、矢量和矩阵可编程性融合到一个平台中,提供了一条跨越式发展的途径。这不一定以牺牲ARM为代价——事实上,ARM甚至可以采用RISC-V矢量和矩阵扩展来巩固其自身的DPU地位。
对于更广泛的行业而言,RISC-V在DPU领域的崛起提供了一个难得的机会来重塑竞争格局。企业不再受ARM许可模式的限制,而是可以根据自身需求调整架构。这对于希望优化功耗、性能和自主权的超大规模计算企业来说尤其重要。RISC-V还避免了垄断局面:与其由单一供应商主导路线图,不如建立一个开放的生态系统,从而培育多条发展路径(SiFive,2023年)。
借助RISC-V,像高通或任何主要供应商这样的公司都将占据主导地位——能够设计针对其DPU架构优化的独特定制CPU,而无需依赖ARM的许可条款和路线图。随着DPU成为数据中心基础设施的核心,这种独立性可能成为关键的差异化因素。
时机已到。AI驱动的数据中心架构正在蓬勃发展,DPU不再仅仅用于网络,而是用于协调计算、存储和AI流程。在这个世界中,结合标量、矢量和矩阵可编程性的DPU看起来比仅集成标量ARM内核和固定功能引擎的DPU更具吸引力。
正如ARM发现并利用DPU的机会超越英特尔和AMD一样,RISC-V现在提供了重新定义这一类别的机会。供应商无需在GPU领域与NVIDIA正面交锋,也无需试图重振CPU,而是可以借助可编程的DPU平台实现跨越式发展,该平台可以重塑数据中心基础设施。这将是一个东山再起的故事——不是重复旧的战斗,而是开辟新的战线。
业界常常将RISC-V描述为CPU领域的一个故事——无论它能否取代ARM或x86——或将其视为边缘物联网的利器。然而,更具颠覆性的机会可能在于数据中心的控制平面。ARM打造了英特尔和AMD从未预料到的DPU专营权,而现在RISC-V有机会凭借矢量和矩阵可编程性重新定义这一类别。最终,ARM和RISC-V可能会在DPU领域共存——ARM保持其主导地位,而RISC-V则提供开放、可定制的替代方案——随着市场的成熟,这将为供应商和超大规模计算提供商提供更多架构选择。
参考链接
https://semiwiki.com/ip/risc-v/360434-can-risc-v-help-recast-the-dpu-race/
