跨界造芯“卷”上云,云计算厂商角逐服务器芯片

数据中心是云计算产业的底层核心基础设施,也是云计算厂商的重要抓手。服务器是数据中心基础设施的重要组成部分,其中的CPU、GPU决定了服务器的算力。信通院数据显示,服务器在数据中心硬件成本中占比70%左右。

QQ截图20211119092508.png

本文来自半导体产业纵横,作者/熊熊。

在服务器芯片领域初露头角的云计算厂商,意欲何为?

随着数字技术向社会各领域的全面持续渗透,现代社会算力需求愈加迫切,云计算厂商作为算力的重要供给方,将面临新的发展机遇,工信部发布的《2021年通信业统计公报》显示,云计算已经成为新兴业务中增长最快的领域,相关业务较上年增长91.5%。

数据中心是云计算产业的底层核心基础设施,也是云计算厂商的重要抓手。服务器是数据中心基础设施的重要组成部分,其中的CPU、GPU决定了服务器的算力。信通院数据显示,服务器在数据中心硬件成本中占比70%左右。进一步的,芯片成本则占据服务器成本的绝大部分。根据IDC的研究数据,CPU、GPU、DRAM三个模块中的芯片成本在基础型服务器中占比约30%,在更高性能的服务器中,占比高达50%-80%。

但是,服务器芯片市场还是处于被龙头垄断的阶段。根据市场调研机构IDC的报告,英特尔占据了服务器CPU市场近九成的份额,英伟达占据独立GPU市场份额近八成。

因此,除了芯片赛道的专业选手外,AWS、谷歌等云计算厂商也纷纷跨界,下场造芯。

云计算厂商为何选择自研芯片

“自渡”才是底气

从外部的供应链因素来看,现今的全球半导体供应链风云莫测,尤其新冠疫情在全球爆发后,涨价、缺货的现象层出不穷。

今年2月,英特尔CEO Pat Gelsinger也证实,英特尔代号为Granite Rapids的服务器芯片将从2023年推迟至2024年发布。Granite Rapids是一款采用Intel 3制程工艺的产品,英特尔改变了产品路线图,这可以让Granite Rapids芯片性能更好。而此前,英特尔也推迟了服务器芯片Sapphire Rapids的上市时间,推迟后的生产时间表比预期晚了三个月。

今年1月份,有消息指出,AMD旗下的EPYC服务器处理器出现了接近10%-30%的价格涨幅,并且还出现了缺货的迹象,因此有多家服务器制造商正在寻求进一步的采购,通过加价购买产品。

而无论是推迟新品发布,还是涨价,对于其下游的云计算厂商来说,都会产生影响。芯片作为整个科技产业的“底座”,夯实底座才能赢得未来。与其全靠他人,不如努力“自渡”,云计算厂商自研服务器芯片可以减轻对第三方供应的依赖,获得更大的生产自主度。

满足需求,是云计算厂商的主要目的

云厂商可以对云上客户的需求有深刻的理解,从需求入手,逆向工作设计芯片,既是云计算厂商的工作重点,也是他们在服务器自研芯片发明方面的最大优势。

从2013年起,AWS就开始自研芯片的创新,到现在已经有9年的历史了。目前已拥有完整的自研芯片产品家族。AWS做芯片的核心目的并不是与传统芯片厂商竞争,而是基于企业客户对性能、成本的核心需求,向客户提供与现有的云服务一起打包的软硬一体方案。

服务器芯片并不能单单追求性能,如何满足客户需求才是云计算厂商更应该考虑的事情。

降低成本与价格,也是提高竞争力的手段之一

据Gartner数据,2021年全球云计算IaaS市场份额中,AWS占据38.92%的市场份额,微软占据21.07%的市场份额,排名之后的就是阿里云、谷歌云、华为云和腾讯云,市占率均不到10%。

现在来看,头部全球云服务厂商的市占率基本定型,各家厂商的价格也会成为拉新留存客户的重要手段。而云服务厂商要考虑的就是如何降低成本,自研芯片是降低成本最关键的环节。自研芯片能提供供应链的优势,降低采购芯片的成本,云厂商生产产品的性价比也更高。

云计算厂商开启自研

AWS开创了云厂商自研芯片的先河。从2013年推出首颗Nitro1芯片至今,已经有八年自研芯片历史的AWS已拥有网络芯片、服务器芯片、人工智能机器学习自研芯片三条产品线。其中,Graviton系列是AWS自研的基于Arm架构的服务器芯片。

去年12月,AWS推出了Graviton3,采用5nm工艺,64核,集成了550亿晶体管,主频2.6Ghz,支持bfloat16(为深度学习而优化的新数字格式),PCIe5.0。与Graviton2相比,Graviton3处理器支持为科学计算、机器学习和媒体编码工作负载提供高达2倍的浮点运算性能,为加密工作负载速度提升高达2倍,为机器学习工作负载提供高达3倍的性能。

Graviton3处理器的能效也更高,在相同性能下,与同类型基于x86的实例对比,可节省高达60%的能源消耗。

除了AWS之外,谷歌也推出历时4年打造的Tensor芯片,采用三星5nm工艺打造,为8核心,包括2个Cortex-X1超大核(主频2.8GHz),2个A76大核(主频2.25GHz)和4个A55小核(主频1.80GHz),集成20核Mali-G78 MP20 GPU。

Arm架构风生水起

长期以来,x86架构在PC及服务器领域占据统治地位,而Arm架构在移动终端和嵌入式领域应用较为普遍。x86的方向是高性能方向,因为它追求一条指令完成很多功能,而Arm的方向是面向低功耗,要求指令尽可能精简。x86和Arm的各自主要方向决定了他们的市场。x86的市场主要是PC和服务器,因为需要高性能。Arm的市场主要是手机和平板,因为需要低功耗。

但是近年来,在智能手机、平板电脑等智能终端以外,Arm不断延伸至物联网、数据中心等领域,地位不断提升,向传统x86领地发起进攻。

数据中心服务器对定制化、微型化、高扩展性的要求更高,Arm也更符合这些趋势和要求。与x86架构相比,Arm的优势在于可降低硬件成本、提高效率。Arm架构仅保留所需要的指令,可以让整个处理器更为简化,拥有小体积、高效能的特性,且能够胜任简单但多线程的负载。除此之外,Arm架构处理器的核心负担相较x86处理器低上许多,并且因为早前应用处理器的需求就是以低功耗为重点,即便如今效能不断提升,仍是以保有省电的特性为前提发展。

据集邦咨询预测,2025年Arm架构在数据中心服务器的渗透率将达到22%,这也意味着Arm架构可能会逐步改变数据中心服务器市场格局。

对于云服务商来说,自研Arm架构芯片也是很有必要的。x86架构的CPU受限于英特尔和AMD,云计算厂商无法做进一步特性优化。在当前头部几家云计算厂商已发展成熟并进入竞争阶段的情况下,每一家都需要做出更多差异化,以及综合竞争优势,从这个层面来说,自主研发可控的Arm芯片也就具备一定的战略意义。

公开数据统计,AWS在2021年Arm架构处理器的部署已达其整体服务器建置的15%,并将于2022年超过20%。

除了AWS外,2020年,业界也曾经传出微软正计划开发Arm架构服务器芯片的消息。确实,微软一直布局开发自己的服务器芯片,据报道,微软希望扩大自己的服务器芯片业务,已经从苹果公司聘请了著名的芯片架构师Mike Filippo来加强自己的芯片研发能力,这些芯片为Azure云计算服务提供支持。

国内厂商中,阿里巴巴和华为也正在布局Arm服务器芯片。

2019年,华为旗下的海思半导体推出了基于Arm架构的服务器芯片鲲鹏920。鲲鹏920是目前业界最高性能Arm-based处理器。该处理器采用7nm制造工艺,典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%。同时,能效比优于业界标杆30%。鲲鹏920以更低功耗为数据中心提供更强性能。

但受制于制裁,下一代的鲲鹏930无法如期发布。2021年4月,华为轮值董事长徐直军预计,短期内无法解决鲲鹏芯片代工的问题,但鲲鹏本身是一个Arm的生态,华为仍会坚定不移地去推进。

2021年10月,阿里巴巴旗下半导体公司平头哥发布自研云芯片倚天710。

倚天710采用最新的Armv9架构,基于最先进的5nm工艺,单芯片集成600亿晶体管,CPU核心数高达128个,最高主频为3.2GHZ,能同时兼顾性能和功耗。倚天710不仅是全球首款采用5nm工艺的服务器芯片,也集成了最新的内存DDR5和PCIE5.0,能有效提升芯片的传输速率,并且可适配云的不同应用场景。

标准测试集SPECint2017的数据显示,倚天710的分数达到440,超出业界标杆20%,能效比提升50%以上。

由于x86架构已经形成了完善的产业和生态环境,是整个产业中最庞大、最完善、应用最广泛的处理器架构之一,生态壁垒极高。因此,Arm架构若想在服务器市场中,与x86架构分庭抗礼,还有一定的难度。

但是,众多巨头加入Arm阵营,预示着Arm的生态将会越来越完善,Arm架构在服务器市场份额也会不断增长。

对于整个行业来说,云厂商“卷”到服务器芯片市场,也会影响原有的市场格局。云厂商的自研芯片根据自己的技术路径按部就班的发展,加之云厂商的服务器芯片在未来也将不断的应用在自己的服务器中,英特尔和AMD的新一代服务器CPU将与云服务提供商的CPU更新速度不一致。

但是对于云厂商来说,自研服务器芯片是他们能充分掌握自主权迈出的一大步。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论