谷歌研究团队最新发布的TurboQuant压缩算法,能够在保持准确性的同时大幅减少大语言模型的内存占用并提升运行速度。该算法通过PolarQuant技术将向量坐标从标准XYZ坐标转换为极坐标系统,并结合量化约翰逊-林登施特劳斯技术进行误差修正
Token作为AI模型处理信息的最小计量单位,是衡量AI活跃度与产业价值的核心指标。中国Token调用量的爆发式增长,直接体现了中国AI产业的发展速度,也折射出全球AI应用格局的深刻变化,而中国取得这一领跑成绩,绝非偶然,而是多重因素协同作用的结果。
AI热潮中,一个概念的地位正在渐渐凸显——Token,它是排行榜上大模型调用量的评估标准,也是大模型厂商销售套餐的计费单位。
国家数据局党组书记、局长刘烈宏在中国发展高层论坛2026年年会的演讲中介绍称,“预计到‘十五五’末,中国人工智能相关产业规模将突破10万亿元,迈向更广阔的增长空间。”他透露,今年3月,中国日均Token调用量已突破140万亿,两年增长超千倍。
而AI应用爆发背后,是对云服务器与大模型调用的高度依赖,指数级增长的Token带来的成本账单,让此前靠免费或低价维持用户的大模型厂商最先感受到压力,然后传导致AI算力核心的云服务厂商和大模型服务商。
2025年初,DeepSeek横空出世,凭借高性价比和开源特性,向全世界展示了开源对AI创新激发出的蓬勃力量及中国AI产业的无限可能。2026年初,面向AI应用开发者的全球大模型聚合路由平台OpenRouter显示,中国大模型调用量已连续两周超越美国模型。