本文来自极客网(www.fromgeek.com)。
极客网·人工智能5月28日在人工智能领域,Token就是这个世界的硬通货。读懂Token,就能看清AI的计费逻辑、成本压力,以及厂商与用户之间的博弈关系。

谷歌衡量AI业务爆发式增长,唯一的计量单位就是Token。谷歌首席执行官桑达尔・皮查伊在最近的I/O开发者大会上公布,公司每月处理的Token总量高达3.2千万亿。他笑着补充:“我从没想过自己会说出‘千万亿’这个词,但现实就是如此。”
简单来说,Token是大语言模型(LLM)处理数据的基本单位,被称作驱动AI革命的“新石油”。对AI服务商而言,它是计量用量、设定价格的标尺;对企业用户来说,它是换取算力、实现AI能力的核心成本。
市场对Token的需求近乎无限,这进一步加剧了全球GPU资源短缺,反过来又持续推高使用AI工具的整体成本。
Token究竟是什么?
和人类理解语言的方式类似,大语言模型会把句子拆解成一个个Token,以此理解语义。皮查伊将其定义为:“模型处理数据的基本单元,每一个Token往往对应一个待解决问题的片段。”
Token的形式不固定,可以是完整单词、词根,也可以是字母串、符号或短语,复合词还会被拆分成多个Token。比如输入提示词“I am running after a car”,模型会拆成“I”“am”“run”“ing”“after”“a”“car”,共7个Token。
Gartner高级总监分析师迪帕克・赛斯给出了通用换算标准:1个Token大约相当于0.75个英文单词,100个单词约等于135个Token。
Token定价有门道:上传便宜,下载更贵
Token并非统一定价,核心差异在于“上传”和“下载”——向AI系统上传内容的Token价格更低,而获取AI生成结果的下载Token价格更高。
举个例子,用户上传一份简历只需支付少量费用,但下载经AI润色优化后的简历,费用会明显增加。ManpowerGroup数据科学与AI解决方案负责人马克斯・利明解释:“上传成本低,因为AI还未进行深度运算;下载成本高,是因为AI已经完成了分析、生成等核心工作。”
目前,Token计费模式主要面向企业和程序员这类重度用户。Anthropic的Claude Code、OpenAI的Codex均采用Token计费;微软GitHub也宣布,将于6月1日起推行类似的Token计费机制。
企业最终的AI账单由两部分组成:Token费用+算力费用(如GPU使用时长)。利明提到,Max Leaming一方面向模型厂商支付Token费用,另一方面还要承担独立的算力成本。目前,该公司使用微软Azure云服务,搭配Snowflake数据库运行AI相关业务。
高效模型:用更少Token办更多事
不同AI模型的Token使用效率差异很大,优质模型能以更低Token消耗,输出更优质的结果,直接帮企业节省成本。
皮查伊在大会上重点提到谷歌新推出的Gemini 3.5 Flash,这款模型采用Token计费,却能以不到同类顶级模型一半的价格,提供前沿水平的AI能力。
“我们了解到,不少企业已经用光了年度Token预算,”皮查伊说,“如果企业混合使用Gemini 3.5 Flash和其他顶级模型,能大幅降低整体成本。”
提示词效率,决定Token成本的关键
提示词(Prompt)的编写效率,直接决定Token消耗多少。Gartner分析师赛斯举例称,同样完成一项编程任务,有人用10000个Token才能搞定,有人仅需1000个,但目前还没有工具能精准衡量这种效率差异。
“越来越多企业开始转向按最终效果付费,因为大家逐渐认清Token的真实成本,开始重视Token使用效率。”赛斯说。
ManpowerGroup就针对这一点,开发了简化用户数据查询流程的看板工具。起初,新用户使用内部劳动力市场数据工具,需要10轮追问才能获取目标结果;一年后,用户平均仅需4轮追问,Token消耗大幅减少,效率显著提升,背后核心原因就是提示词编写更精准高效。
不过高效也分两面,部分顶级AI工具定价极高。比如Anthropic尚未公开的Mythos大模型,推理能力远超同类,但单Token价格堪称天价。利明认为:“即便单Token成本上涨,整体使用成本反而可能下降,因为它的效率足够高。”
AI厂商的“成瘾式”商业模式
头部AI厂商投入巨额资金搭建AI基础设施,却刻意压低Token单价,这被业内称为“成瘾式策略”,即先让用户对AI服务产生依赖,后续再通过涨价收割利润。
利明补充,免费Token是厂商锁定客户的重要手段。向企业提供免费Token,会促使企业将核心业务流程绑定到厂商专属的大语言模型和AI智能体上。为进一步巩固绑定,主流AI厂商还会派出工程师驻场,为客户部署AI模型。
这类工程师被称为前线工程师(FDE),相当于AI领域的“专属顾问”,帮客户制定AI战略、搭建技术框架、解决推理与上下文理解难题,还负责处理安全问题,深度参与客户AI项目落地。
如今,OpenAI、谷歌、微软早已不再只卖AI模型,而是转向“深入企业内部,帮客户搭建专属AI基础设施”的服务模式。
免费Token,成为工程师的新型职场福利
英伟达CEO黄仁勋曾提到,免费Token如今已成为工程师的求职福利,就像企业为员工报销手机话费一样普遍。
利明表示自己尚未见过这类案例,但他认为这种模式暗藏风险,因为雇主提供的免费OpenAI或微软Token,本质是一种间接的厂商锁定。“员工习惯了某款AI工具,就会越来越依赖它,企业后续很难更换供应商。”
同时,免费Token也降低了前沿AI技术的试错门槛。不少企业高管会自费测试OpenClaw,即那项被视为突破性但暂不适合企业正式使用的高风险AI技术。ARM AI与开发者平台高级副总裁亚历克斯・斯皮内利就有过这样的经历:“我测试OpenClaw时,一次配置错误,一个周末就产生了500美元账单。这世上没有免费午餐,Token真的很贵。”
赛斯将免费Token策略,比作印度一家烟草公司曾给员工发放香烟的做法:“员工领了香烟就会抽,慢慢养成习惯。免费Token也是如此,一旦用上,就离不开了,因为它已经成了AI世界的硬通货。”
