本文来自微信公众号“电子发烧友网”,【作者】黄山明。
电子发烧友网报道(文/黄山明)近日,据新华社报道,上海交通大学集成电路学院陈一彤课题组在新一代光计算芯片领域取得重大突破,首次实现支持大规模语义媒体生成模型的全光计算芯片LightGen,相关成果已经发表于国际顶级学术期刊《科学》(Science),并被选为高光论文重点报道。
这是国际上首次实现大规模全光生成式AI芯片,标志着光计算在生成式AI领域的应用从理论可行性迈入实际效能领先阶段。
全光计算芯片LightGen,突破三项世界级技术瓶颈
资料显示,LightGen定位专为大规模生成式人工智能任务设计的全光端到端计算芯片,主要应用在高分辨率图像生成、3D场景重建、高清视频生成、语义操控、去噪、局部/全局特征迁移等复杂生成任务。
要知道,生成式AI通常需要处理高维张量数据,这就要求芯片具备超大规模的并行计算能力,就好像一个工厂需要生产大量产品,就需要有足够多的员工同时干活。
而传统的光芯片问题在于,无法在单片上集成足够多的光学神经元,并且光信号容易互相干扰。因为光本身具有衍射性和相干性,如果芯片上集成的光学神经元太密集,相邻的神经元的光场就会互相干扰,导致计算出错。
并且光学神经元需要在芯片上加工纳米级的光学元件,这些元件的尺寸远小于电子芯片的晶体管,加工精度要求极高。
LightGen则采用高密度光子集成架构,在仅136.5平方毫米的芯片上集成了200多万个光学神经元,并通过特殊材料和结构设计,解决了串扰和热漂移问题,首次实现了大规模光学神经元的可靠集成。
此外,光不能直接做“非线性激活”,而所有深度神经网络都依赖非线性激活函数(如ReLU、GELU)。但在纯光域中,光与光之间几乎不相互作用,打个比方,真空中两束激光交叉并不会互相影响,这就导致天然缺乏非线性。
以往的光计算芯片只能做线性运算,遇到非线性层就必须把光信号转成电信号,再用电子电路处理,再转回光。这个过程就叫O-E-O(光-电-光转换),不仅速度慢、功耗高,带宽瓶颈也很严重,完全抵消了光计算的速度优势。
LightGen芯片攻克全光域高维特征空间变换难题,实现从低维输入到高维特征的直接转换,可以无需电子辅助,完全通过光场调控完成维度转换,保持光计算的高速特性。
再一个,生成式AI模型通常用“无监督学习”训练,即模型在没有人工标签的情况下,自己学会生成新内容。但光子芯片此前只能做“有监督学习”,原因主要是缺乏可微分的训练机制,以及光子权重更新困难与无法自主“理解”语义。
而LightGen芯片团队提出贝叶斯无真值训练算法(BOGT),解决了光场训练缺乏标注数据的核心难题,使光芯片具备自主学习能力。该算法在光子硬件上实现了可微分的梯度近似,使光子芯片也能像电子神经网络一样,进行端到端的生成式训练。
性能飞跃,走向全面自主
陈一彤课题组不仅解决了光芯片三项世界级技术难题,也让LightGen实现了性能上的飞跃。通过极严格算力评价标准的实测表明,即便采用性能较为滞后的输入设备,LightGen仍可取得相比顶尖数字芯片2个数量级的算力和能效提升。
从参数来看,该芯片面积仅136.5平方毫米,集成200多万光学神经元,算力达3.57×10⁴万亿次/秒,能效664 TOPS/W,较英伟达高端计算卡(A100)提升两个数量级,理论上最高可提升7个数量级。
这意味着该芯片如果能够量产,有望解决生成式AI算力短缺、能耗高企的问题,为AI在医疗影像、工业设计、元宇宙、自动驾驶等场景的规模化应用提供核心算力支撑。
而LightGen的出现,也标志着我国在下一代算力芯片国际竞争中占据有利位置,突破了对高端电子芯片的依赖,有助于推动国产AI算力生态的自主可控。
另一方面,随着生成式AI的规模化应用,需要使用大量算力,而传统电子芯片的高能耗已经成为瓶颈。而LightGen的能效的巨大提升,可直接降低数据中心的电力需求与PUE值(电源使用效率),缓解当前数据中心面临的电力短缺与“碳排放”问题。若大规模应用,可使AI数据中心能耗降低90%以上,缓解“算力黑洞”问题。
值得一提的是,LightGen采用薄膜铌酸锂(LNOI)和磷化铟(InP)等非硅基光子材料,以克服硅在电光调制速度、片上光源集成和高效非线性光学响应等方面的物理限制,从而实现高性能全光神经网络。
简单解释一下,原因在于硅是一种半导体,不是理想的绝缘体。当用高强度的光照射硅时,两个光子可以同时被一个硅原子吸收,激发出一个自由电子。这些被激发出来的自由电子会像云一样在材料中漂浮,它们会进一步吸收后续通过的光信号。这个过程不仅严重增加了光信号的损耗,还会改变材料的折射率,导致计算结果出错。
而LNOI是一种宽禁带绝缘体,它的能带结构决定了它在通信和计算常用的光波段下,几乎不会发生双光子吸收,避免了硅材料的缺陷。
更重要的是,LightGen为生成式AI、科学计算提供了不依赖先进制程的替代方案,规避EUV光刻机限制。因为光芯片的核心结构是光波导、微环谐振器、调制器等,这些器件通常在几百纳米到几微米量级,因此无需EUV,主流使用DUV光刻甚至电子束光刻即可制造。
这也意味着,我国可以建立不依赖传统半导体产业链的全新光计算生态,掌握核心技术自主权。为AI大模型、高性能计算等战略领域提供不受制于人的算力保障,最终实现算力自主可控。
总结
LightGen芯片的诞生,标志着我国光计算的重大突破,其非硅基、非电子依赖的特性,为解决当前AI算力的能耗瓶颈与硅基依赖问题提供了全新路径。这种突破不仅具有技术上的颠覆性,更对“双碳”目标下的绿色AI发展具有深远意义。业内评价认为,LightGen不仅是实验室突破,更展示了光计算在复杂生成任务中的实用化潜力,为我国在前沿人工智能领域的竞争提供了关键硬件基础。
