芯片行业,最担心的事发生了

编译自HPCwired
云计算巨头和人工智能巨头几乎已经抢购一空了所有可用的资源。好消息是供求规律依然有效。坏消息是,这条规律意味着处理器、存储设备和内存的价格飙升。

本文来自微信公众号“半导体行业观察”,编译自HPCwired。

人工智能时代的到来让硬件炙手可热,无论从字面意义还是比喻意义上来说都是如此。不幸的是,对基础设施的巨大需求彻底扰乱了芯片、内存和磁盘的供应链,使得人们几乎不可能在不倾家荡产的情况下获得运行企业IT工作负载(更不用说高性能计算或人工智能作业)所需的硬件。那么,普通人该如何在这个充满机遇却又价格不菲的新世界中生存下去呢?

这是一个非同寻常的时代。人工智能(GenAI)的蓬勃发展带动了全国乃至全球数据中心建设的激增。在美国,目前约有3000个数据中心项目正在建设或规划中,这将进一步壮大现有的4000个数据中心。这些“人工智能工厂”大多由超大规模数据中心运营商和人工智能巨头打造,其占地面积可达百万平方英尺,耗电量高达1吉瓦。

除了建造数据中心本身所需的混凝土、钢材和铜管(更不用说供电和冷却用水了),还需要服务器、内存和存储设备来填充数据中心内部。问题是,云计算巨头和人工智能巨头几乎已经抢购一空了所有可用的资源。

好消息是供求规律依然有效。坏消息是,这条规律意味着处理器、存储设备和内存的价格飙升。

已取消的订单

以普通DDR内存为例。随着高带宽内存(HBM)需求的飙升,三大内存芯片制造商——SK海力士、三星和美光——都削减了普通DDR内存的产量。结果是,过去六个月里,普通DDR内存的价格上涨了数百个百分点。

这给下游技术用户带来了一系列问题,其中包括Cox Communications旗下的云服务提供商RapidScale。RapidScale通常每年都会为其不断增长的云业务采购一定数量的服务器,但今年的采购流程却异常异常。

RapidScale总裁杜安·巴恩斯表示:“去年12月,一台配备2TB内存的服务器售价约为3万美元。而如今,同样的服务器售价已达8万美元。”

成本上涨迫使原始设备制造商(OEM)不得不做出艰难的商业决策。今年早些时候,RapidScale向一家大型OEM供应商订购了价值120万美元的新服务器。Barnes表示,这家计算机制造商不仅没有按约定价格交付服务器,反而违背了协议,并试图将价格提高300%。

“我们当然不是唯一一家被他们拒付订单的客户,”巴恩斯在一次采访中说道。“如果我以低于市场价的价格把东西卖给客户,我仍然会履行订单,并在下一个订单和下一个客户那里弥补损失,就像任何正常的商家都会做的那样。他们选择了另一条路,这是他们的决定,他们的生意。但归根结底,我认为这不是处理生意的好方法。”

共同负担

其他供应商则采取了更为开放的态度来应对这一前所未有的局面。4月23日,存储供应商Everpure(前身为Pure Storage)的首席执行官兼董事长查理·詹卡洛(Charlie Giancarlo)发表了一封公开信,就年初以来平均70%的价格上涨向客户致歉。更重要的是,他还详细解释了此次涨价的原因和理由。

“70%的涨幅乍看之下似乎难以接受,但了解背后的真相后,便会明白其中的道理,”Giancarlo在博文中写道。“Everpure公司许多大批量半导体元件的原材料成本已经飙升了300%。”

自2025年年中以来,涨幅高达900%(4倍至10倍)。在某些情况下,由于需求激增,供应商无法按承诺的数量供货,迫使我们寻找替代货源(价格更高)以满足承诺的交货时间。

正如詹卡洛所指出的,价格从2025年第三季度中期开始上涨。随后,价格从12月到1月几乎翻了一番,并在2月到3月间再次翻了一番甚至两番。尽管1月份成本持续上涨,Everpure仍信守承诺,按照60至90天的付款期限向客户提供报价。

该公司还告知其客户和渠道合作伙伴,新财年(始于2月1日)将提价。Everpure也已将付款期限改为30天,以最大限度地减少其因零部件成本持续上涨而面临的风险,其他供应商也在采取同样的做法。

“我们将价格涨幅控制在远低于实际供应链成本涨幅的水平,”詹卡洛写道。“我们不会从这场危机中牟利……我们选择与客户共同承担责任。”

这对顾客意味着什么

现实情况是,数据中心的所有成本都上涨了。每个客户的情况都不一样,但他们仍然有选择。

一种选择是从云端获取更多计算能力,而不是扩展本地部署。毕竟,超大规模数据中心运营商正在大量采购处理器、内存芯片和NVMe固态硬盘,以应对预期中人工智能工作负载需求的激增。

正如存储供应商Qumulo的高级副总裁兼产品负责人Brandon Whitelaw在最近一篇BigDATAwire的报道中指出的那样,大型云公司今年已在基础设施方面投入了7000亿美元,几乎垄断了市场。如果原始设备制造商(OEM)难以采购设备,那么与云服务提供商达成交易的可能性就很大。

“早在2021年,排名前五的超大规模云服务商的支出约为1000亿美元,与七大企业硬件供应商的支出相当,”怀特劳在《云计算已经抢占了你的硬件市场份额》一文中写道。“到2025年,前五大云服务商的支出已跃升至4100亿美元,同比增长至7000亿美元——是七大企业硬件供应商总支出(1450亿美元)的两倍。”

Whitelaw建议客户花时间构建统一的数据架构,以此作为降低存储成本的一种方法。通过消除单一架构中的数据孤岛,可以降低总存储需求并提高效率。统一的数据架构还能帮助客户更高效地利用跨本地和云端的混合云存储环境,并允许客户根据价格信号灵活调整存储。

RapidScale总裁Barnes建议客户采用FinOps实践,以降低云环境支出并提高现有投资的利用率。RapidScale在其云产品中提供FinOps服务,但任何客户都可以采用FinOps,无论是在云端还是本地环境中。

“我已经有了基础设施。我觉得我需要更多,但我真的需要更多吗?”巴恩斯说。“我们可以向您展示优化基础设施的现代技术,然后制定一个更经济合理的方案,分阶段实施,帮助您度过未来几年的混乱时期。”

对于许多需求稳定且可预测的工作负载(包括部分高性能计算和人工智能工作负载),云计算因其成本高于本地部署而备受诟病。如需了解财务运营(FinOps)降低成本的三种主要方法,请参阅BigDATAwire于2025年4月发表的这篇文章。

最后一个选择就是静观其变,希望这场风暴在一两年内过去。巴恩斯说,他与许多首席信息官和副总裁交谈过,他们都把服务器升级项目推迟到了2026年。“他们希望明年价格能降下来,”他说。“这有点像能源危机。如果我不需要休假,我就不会开车去佛罗里达,然后花六美元一加仑的油钱。”

遗憾的是,芯片价格似乎短期内不会下降。新的芯片制造厂正在建设中,但短期内无法投产。例如,美光科技正在纽约州北部建设一座新工厂,但要到2028年才能开始生产DDR或HBM内存。

毋庸置疑,这是一个激动人心的时代。人工智能淘金热可能会让少数几家成功发家致富的公司一夜暴富,而工具提供商也只是略有斩获。然而,不幸的是,人工智能的蓬勃发展也扰乱了供应链,影响到所有需要电脑的人。那些能够制定应对这些冲击的计划的客户,很可能比那些没有计划的客户在这次热潮中获益更多。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论