导航菜单

谷歌基于AI的Translatotron可以将语音转换为语音

谷歌宣布推出Translatotron,这是一种“语音到语音翻译系统”,可以在保持演讲者的声音和信心的同时将语音翻译成语音。

Google AI在博客中写道: “ Translatotron是第一个可以将一种语言的语音直接转换为另一种语言的语音的端到端模型 。”

根据Google的说法,Translatotron基本上包括三个部分。第一部分是自动语音识别,它将源语音转换为文本。第二部分称为机器翻译,它将转录的文本翻译成目标语言。最后一部分是文本到语音合成(TTS),用于从翻译后的文本生成目标语言的语音。

Translatotron基于序列到序列的网络模型,该模型将源频谱图作为输入并生成目标语言翻译内容的频谱图。然后,它使用神经声码器和扬声器编码器,用于保持扬声器的声音。

博客文章指出:“我们希望这项工作可以作为端到端语音到语音翻译系统未来研究的起点。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。