站长之家(ChinaZ.com) 7月19日 消息:据外媒报道,谷歌人工智能部门一直在开发专门针对语言障碍人士的新软件。
Big G在一篇最新的文章中提出一种新的语音转换成文本软件“Parrotron”,专门为有语言障碍人士设计。Parrotron在一个深度神经网络运行,该神经网络被训练用来将非典型的语音模式转换成流畅的合成语音。有趣的是,这项技术不依赖唇形变化等视觉效果。
未来提高准确率,谷歌给神经网络提供了“近30, 000 小时由数百万个匿名话语对组成的语料库。这项技术从本质上把“聋哑人的单词错误率从89%降低到25%”,但是谷歌希望能进一步改善结果。
目前,完整的研究已经发布在ArXiv上,感兴趣的网友还可以在GitHub库中找到更多的Parrotron的例子。
相关文章:
(举报)