我正在为VUI工具编写和标记语音。我们正在为我们的TTS服务使用Google Cloud Wave-net,并且我一直在尝试使用SSML使TTS输出更加自然。当我添加标签“ prosody”时,TTS输出会在标签开始之前添加一个暂停,如下所示:
<speak>
Rebecca is allergic to <prosody rate="slow" range="high">soybean oil.</prosody> Would you like to cancel this order?
</speak>
在此示例中,TTS输出在“至”和“豆油”之间暂停。这只是一个愚蠢的例句,但是在我们的实际产品中,我们需要使用这种标签来强调和区分复杂的单词。
其他人遇到过此问题吗?有提示吗?