Token成本让企业不堪重负,OpenAI与Anthropic准备打价格战

看起来当前的AI产业一片红火,但企业在使用AI时面临预算压力。它们正在寻找缩减AI使用量的方法,或者想以更有目的、更高效的方式使用新技术。

本文来自极客网(www.fromgeek.com)。

OpenAI与Anthropic之间可能正在酝酿价格战,《华尔街日报》报道称,OpenAI考虑对企业客户进行大降价,并预计Anthropic也会下调价格。

看起来当前的AI产业一片红火,但企业在使用AI时面临预算压力。它们正在寻找缩减AI使用量的方法,或者想以更有目的、更高效的方式使用新技术。

20260616827494.png

一些企业用户的AI年度预算在极短时间内被消耗殆尽。年初时,预算耗尽还不是一个问题,大家当时还对价格比较满意;但现在,它已经成为阻碍AI发展的最大问题。

OpenAI企业级产品旨在帮助客户企业改善或提升自身产品、服务或工作流程的效率,它会成为降价重点。至于个人用户,费用可能不会有变化。

许多企业客户按Token(词元)使用量付费,用得越多,成本越高,类似于用电量或用水量。

约翰斯·霍普金斯大学Institute for Assured Autonomy联席主任、AI专家安东·达布拉(Anton Dahbura)表示:“最贴切的描述是,Token就是在大语言模型执行操作所需的计算资源量度。”

成本压力迫使企业大规模调整

OpenAI当前有企业客户约200万,该公司最大的Token消耗者每月使用量约为1000亿个词元。大约六年前,消耗最多的客户每月只需要10万个词元。

安东·达布拉强调:“我们不应忘记,尽管这项技术正在被大规模部署和应用,但它仍处于早期发展阶段。”企业正在重新评估AI对哪些应用有效、哪些无效。巨大的成本压力正在迫使企业大规模调整。

OpenAI和Anthropic都在谋求上市,在此背景下,降价意味着什么?

Brookings Metro高级研究员、数字经济专家马克·穆罗(Mark Muro)认为:“企业在研发、训练和数据中心方面投入巨资,现在转向软性定价,甚至有可能降价,说明企业的变现能力存在疑问。潜在的价格战暴露出更深层的问题:这些公司真的有护城河吗?它们本质上卖的不是同一种产品吗?这是它们全速前进时必须面对的根本性问题。由于产品具有可替代性,极易切换,它们变得更像社交媒体应用,在需要持续投入的当下,各产品容易陷入残酷的竞争。”

安东·达布拉表示,他不认为价格战会减缓AI的发展或普及。企业需求依然强劲,对于AI开发商而言,推动增长的主要动力仍是投资者的资本,而非客户带来的收入。只要存在合理的商业逻辑,这种发展无论如何都会发生。

实际上,当用户“最大化使用”AI词元时,所需支付的真实成本远高于订阅费。简言之,AI公司目前是在“贴钱”换取用户增长和市场份额。

如果是Claude Max 20x订阅用户,每月付费200美元,极限Token成本(Max Token Spend)约为8000美元。ChatGPT Pro 20x订阅用户每月也是付费200美元,极限Token成本(Max Token Spend)为14000美元。

作为订阅用户,当然是选择极限使用,一旦利用率超过临界点,使用的企业就会亏损。这种模式显然是不可持续的。

迫于压力,一些美国企业开始使用中国开源模型。华尔街日报认为,使用中国开源模型(如DeepSeek)替代前沿模型,成本可降低95%。AI行政助理初创公司Lindy的创始人弗洛·克里韦洛(Flo Crivello)表示,转向DeepSeek V4后,虽然在高级编程任务上仍保留Anthropic模型,但整体已为公司节省数百万美元。

部分大公司开始基于开源模型构建自己的AI,利用内部数据进行微调。虽然初期投入大,但长期来看不仅能降低成本,甚至有可能在特定垂直领域超越前沿模型。

技术进步可能让Token价格暴跌

当然,也有人认为这种担忧是多余的。业界预测,今年晚些时候,将会出现一批新的AI模型,它们性能更优,效率更高,到时AI词元会更加充裕,成本会大幅下降。

OpenAI首席执行官萨姆·奥特曼(Sam Altman)最近表示,AI成本已成为一个巨大问题,公司“有很多方法帮助人们花更少的钱,获得更高的价值”。

Silicon Data的首席执行官Carmen Li指出,许多AI模型的Token价格可能正在下降。

词元价格走低,可能是AI数据中心新技术带来的。NVIDIA的Blackwell GPU目前正在大规模安装,下半年,超级计算机系统将实现规模化运营,从而帮助AI实验室更高效地训练和运行新模型。安装新系统需要一些时间,部分是因为它们需要水冷,并且需要其他复杂的新数据中心配置,但回报可能是巨大的。

SemiAnalysis将NVIDIA顶级的Blackwell系统GB 300 NVL72与上一代系统Hopper HGX 200进行了对比。

在旧系统上,每个GPU每秒生成90个Token;而新的Blackwell系统每秒可生成6,000个。性能提升了65倍。

无论是旧系统还是新系统,耗电量都十分惊人。但Hopper系统每秒产出54,000个Token,而Blackwell系统则达到了280万个,足足高出50倍。

由于这些数据中心极度耗电,电价正在不断上涨。因此,如今评估GPU系统的标准是生成一百万个Token的成本。旧Hopper系统每百万个Token的成本为4.20美元,而Blackwell系统的成本仅为12美分,便宜了35倍。(小刀)

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论