五嘎子 30 分钟前发布 | 6 次阅读 FPGA 语音 语音合成
这是业界首款专用于语音合成算法的 AI FPGA 芯片结构设计, 能将语音生成算法的计算效率提高百倍以上.
Hot chips 31(2019)正在美国旧金山举行, 峰会第二天阿里巴巴带来了《Ouroboros: A WaveNet Inference Engine for TTS Applications on Embedded Devices》的演讲, 并发布了新一代 AI 语音 FPGA 芯片技术 Ouroboros.
阿里巴巴称, 这是业界首款专用于语音合成算法的 AI FPGA 芯片结构设计, 能将语音生成算法的计算效率提高百倍以上.
根据阿里达摩院扫地僧的说法, 用 AI 语音合成算法 WaveNet 生成 1 秒语音, CPU 和 GPU 需要 50 秒的计算时间, 但 Ouroboros 在 FPGA 环境下只要 0.3 秒. Ouroboros 的一大突破, 是用端上定制硬件加速技术替代云端服务器, 避免了对网络连接和云端服务的强依赖性.
针对 ASIC 实现的性能仿真预估表明, Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音 (TTS,Text-to-Speech) 算法 , 实现实时语音合成.
另据了解, Ouroboros 技术同样适用于达摩院于今年 7 月发布的新一代的语音合成算法 KAN-TTS. 该算法将商用系统里的合成语音与原始语音的相似度提高到 97% 以上.
还有消息指出, Ouroboros 技术, 同样适用于达摩院于今年 7 月发布的新一代的语音合成算法 KAN-TTS. 该算法将商用系统里的合成语音与原始语音的相似度提高到 97% 以上. Ouroboros 芯片技术除了语音合成之外, 还将支持 AI 语音识别. 基于 Ouroboros 研发完整的语音 AI 芯片, 有望率先在天猫精灵上落地.
雷锋网注意到, 与阿里近来发布的其它芯片产品一样, 这个产品的命名也很有特色. Ouroboros 中文是衔尾蛇, 是一个古代流传下来的符号, 形象为一条蛇 (或龙) 吞食自己的尾巴, 结果形成一个圆环(有时亦会展示成扭纹形, 即 "∞"), 其名字涵义为 "自我吞食者". 这个符号一直都有很多不同的象征意义, 而当中最为人接受的是 "无限大","循环" 等.
本文由用户 五嘎子 自行上传分享, 仅供网友学习交流. 所有权归原作者, 若您的权利被侵害, 请联系管理员.
来源: http://www.open-open.com/news/view/5199430633816798048