达摩院发布新一代AI语音FPGA芯片,处理速度成百倍提升

Lynn
阿里达摩院介绍,在使用AI语音合成算法WaveNet生成1秒语音的情况下,如果底层硬件采用的是CPU和GPU,生成语音需要花费50秒,但如果采用Ouroboros,在FPGA环境下完成生成只要 0.3秒。

在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros,该技术能将语音生成算法的计算效率提高百倍以上。

阿里达摩院介绍,在使用AI语音合成算法WaveNet生成1秒语音的情况下,如果底层硬件采用的是CPU和GPU,生成语音需要花费50秒,但如果采用Ouroboros,在FPGA环境下完成生成只要 0.3秒。

据悉,Ouroboros的一大突破是用端上定制硬件加速技术替代云端服务器,避免了对网络连接和云端服务的强依赖性。此外,Ouroboros 芯片技术除了语音合成之外,还将支持AI语音识别。

阿里达摩院透露,基于Ouroboros研发完整的语音AI芯片有望率先在天猫精灵上落地,此外它还有可能应用在汽车(比如上汽荣威)和手机上,以支持高德地图的语音交互。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论