有没有一种方法可以在SSML中使用<prosody>标记来调整单个单词而无需暂停(不使用后处理器)

时间:2019-01-24 10:30:54

标签: text-to-speech ssml

在SSML和Google Cloud TTS中使用prosody标签时,如果不创建不必要的停顿,我将无法调整单个单词的属性。

以下代码在“新建”和“视频”之间产生了滞后。有人建议,后处理器可以删除这些暂停,但是我想知道是否有直接在代码本身中进行操作的方法?

<speak>

Hello, and welcome to this<prosody pitch="+3st">New</prosody>Video Tutorial.

</speak>

2 个答案:

答案 0 :(得分:0)

经过测试,似乎无法使用Google Cloud TTS进行此操作。您可以在生成声音文件后手动对其进行编辑,但是这种方式会破坏练习的目的。

答案 1 :(得分:0)

我没有最清楚的答案,因为您的要求不是很受支持。 Prosody 的音高轮廓让你改变句子不同部分的语气。

韵律轮廓示例

<speak><prosody contour="(0%, +20Hz) (20%, +30%) (100%, +20%)"> Hello friends! </prosody></speak>

我仍在尝试这个,但这似乎是完成你想做的事情的一种乏味的方式。

使用轮廓

contour 接受一串元组 "(%position in sentence, pitch调整) (..., ...)

我希望这对您有所帮助,并祝您工作顺利!