如何在Google文字到语音中使用语音或音素发音?

时间:2019-04-16 13:34:46

标签: text-to-speech google-text-to-speech

我一直在尝试让google's text to speech使用“语音”或“音素”发音,但是并没有使其表现始终如一。

我通过使用https://tophonetics.com/只能获得有限的结果 它翻译成“牛疯了”。到“ðəkaʊwɛntmæd”。但是'the''ðə' 听不到。当我尝试“ðɪsɪzsəmfəˈnɛtɪktɛkstˈɪnˌpʊt”时。

是否有任何SSML代码来定义文本的语音块, 可以是“ D,Iz sVm f @ n'EtIk t'Ekst'InpUt”格式 可以用来代替“ðɪsɪzsəmfəˈnɛtɪktɛkstˈɪnˌpʊt” “

1 个答案:

答案 0 :(得分:0)

有一个符合您目的的SSML标签<phoneme>

很遗憾,Google Cloud Text-to-speech当前不支持该功能。 documentation中列出了适用于Google Cloud的SSML标签的子集。 <phoneme>标签不在此列表中。使用Google Cloud text-to-speech-demo进行的实验确认音素被忽略。标签的内容将被读取为普通文本,正如@Trevor在评论中指出的那样。

但是,Microsoft Azure Text-to-Speech和Amazon Polly支持<phoneme>标记。在这两种情况下,可用的音素均限于所用语言的可用音素(请参见here for Azurehere for Polly)。关于排除语言外音素的问题,Azure文档尚不清楚100%,但是使用Azure Text-to-Speech demo进行的实际实验证实它们不能正常工作。在某些情况下,它们似乎至少被所用语言中最接近的等效语言所代替。

仅限于一种语言的音素会严重限制音素标记的用途。例如,您不能使用该功能以第二种语言嵌入正确发音的内容,因为第二种语言通常会包含一些第一种语言不可用的音素。具体的语言对中,每种语言都有一些其他音素无法提供的音素,分别是英语/德语,西班牙语/德语,英语/西班牙语。