我尝试使用Google Text-To-Speech API生成音频文件。因为我的对话中需要其他声音,所以我尝试使用ssml的声音元素:
<speak>
<voice languages="en-US" gender="female" name="en-US-Wavenet-F">Have you got a girlfriend?</voice>
<voice languages="en-GB" gender="male" name="en-GB-Wavenet-B">Yes, I have.</voice>
</speak>
但是它不起作用,只能识别性别属性-只能使用默认语音,而不是所选Wavenet语音。
我的问题-是否可以在一个ssml文件中使用不同的Wavenet声音,或者只能为整个文件全局定义声音?
答案 0 :(得分:0)
我一直面临着同样的问题,不幸的是,根据documentation,目前似乎不支持voice
元素:
请注意,Cloud Text-to-Speech当前不支持W3 SSML规范中描述的所有元素和选项。此页面详细说明了哪些元素和选项可用于您的应用程序。下面提供的W3参考链接可能对其他上下文和示例很有帮助。
我猜您最好的选择是创建几个文件,然后将它们串联起来,至少这是我要做的。
答案 1 :(得分:0)
有趣的事情,您无法使用Cloud Text To Speech中的标签更改语音性别,并通过“ {立即将文本转换为语音”模拟器here进行了测试,但是在Google Actions中使用TTS emulator可以做到这一点,但是SSML的两个引用都是相同的1,2。
我created提出了一项功能请求,要求在公共问题跟踪器上显示“语音选项”,您可以对其加注星标以便在更新时得到通知。请记住,我们没有预计到达时间。