硅谷正经历一场由AI驱动的创业革命。过去"融资-扩员-烧钱"的传统模式,正在被手握AI利器的精悍团队改写。这些平均不足50人的初创企业,凭借AI工具带来的10倍级效率提升,正在以惊人的速度突破增长边界。
DeepSeep之风正盛,将全球科技产业的重心从训练推向AI时代下半程的推理阶段。随着算力需求节节高升,ASIC芯片在这股汹涌的浪潮之下,得以有更多机会在定制化场景中大显身手。值此之际,属于ASIC定制化芯片的时代之幕是否由此拉开?
但DeepSeek R1的横空出世,改写了这一认知,约束条件反而可以推动创新,没有大算力,还可以优化算法。所以现在科技圈普遍出现了一种声音:一个开源、高性能、低部署推理成本的大模型也能带来整个AI产业生态的繁荣,是大家抓紧上车的门票。
就在Grok3发布的当天,DeepSeek团队也发表了一篇论文(https://arxiv.org/pdf/2502.11089),介绍了一种新的稀疏注意力机制(Natively Sparse Attention,NSA),用于提升长文本训练和推理的效率,并具备硬件对齐和端到端训练的特性。
DeepSeek的出现打破了这一困境,使尖端GPU不再是大模型训练的唯一解法,让越来越多的的国内半导体厂商有机会与全球领先的AI模型适配,有望成为驱动国内半导体全产业链发展的新引擎。
在这场没有硝烟的商战中,中国算力市场正经历着深刻的变革。最近发布的《2025年中国人工智能计算力发展评估报告》(以下简称《报告》),把中国算力发展的四大变化,从“幕后”搬到了“台前”。