Question

我尝试使用Google Text-To-Speech API生成音频文件。因为我的对话中需要其他声音，所以我尝试使用ssml的声音元素：

<speak>
<voice languages="en-US" gender="female" name="en-US-Wavenet-F">Have you got a girlfriend?</voice>
<voice languages="en-GB" gender="male" name="en-GB-Wavenet-B">Yes, I have.</voice>
</speak>

但是它不起作用，只能识别性别属性-只能使用默认语音，而不是所选Wavenet语音。

我的问题-是否可以在一个ssml文件中使用不同的Wavenet声音，或者只能为整个文件全局定义声音？

Answer 1

我一直面临着同样的问题，不幸的是，根据documentation，目前似乎不支持voice元素：

请注意，Cloud Text-to-Speech当前不支持W3 SSML规范中描述的所有元素和选项。此页面详细说明了哪些元素和选项可用于您的应用程序。下面提供的W3参考链接可能对其他上下文和示例很有帮助。

我猜您最好的选择是创建几个文件，然后将它们串联起来，至少这是我要做的。

Answer 2

有趣的事情，您无法使用Cloud Text To Speech中的标签更改语音性别，并通过“ {立即将文本转换为语音”模拟器here进行了测试，但是在Google Actions中使用TTS emulator可以做到这一点，但是SSML的两个引用都是相同的1，2。

我created提出了一项功能请求，要求在公共问题跟踪器上显示“语音选项”，您可以对其加注星标以便在更新时得到通知。请记住，我们没有预计到达时间。

如何在ssml中使用具有不同声音的语音元素？

2 个答案: