有没有办法将语音直接转换为SSML?

时间:2017-09-08 04:59:15

标签: text-to-speech speech-to-text speech-synthesis alexa-voice-service ssml

正如人们能够使用各种语音到文本的“听写”工具将语音单词转换为相应的文本一样,我想知道是否有类似的工具将语音单词转换为相应的SSML。也就是说,除了与演讲者的声音中存在的任何语调,韵律,暂停/休息,变形等相关的相关SSML标签之外,它还将提供文本。

1 个答案:

答案 0 :(得分:0)

我正在构建语音应用程序。在我正在从事的最新项目中,我们需要文本听起来正确无误,并带有所有相关的语调,韵律,停顿/中断,转弯等。 在广泛的研究中,我们发现使文本听起来像是真实的人说的唯一方法是使用SSML(仍然不够完美)或录制的mp3。

如果您想让一个项目具有真实的感觉,执行该项目的最佳方法就是利用人。我建议您录制mp3(/由专业人士录制),而不要尝试从语音中获取SSML。

我们使用SSML的原因恰恰是计算机无法理解人类语音的相关语调,韵律,暂停/中断,转弯等。

如果您的目标是获取SSML,那么最好的方法是将文本转换为SSML。为此,我建议您在这里看看:

W3C SSML

Google SSML

Amazon SSML

据我们所知,2018年7月中旬为止。 如果有人有更多信息,请添加到该答案中。

希望这会有所帮助:3