文本到语音和附带的元数据

时间:2016-03-29 09:56:01

标签: speech-synthesis

我想将文本转换为语音,并提供附带的元数据,以确定每个单词在其周期和周期中出现的间隔。所以"狗吃了#34;可能是

:开始0,结束.3s 狗:开始.5s,结束.8s 吃了:开始.11s,结束.14s

是否有将文本转换为语音的方法,并且除了通过生成的音频文件寻找暂停之外,还获得了此类数据。 干杯

1 个答案:

答案 0 :(得分:0)

iSpeech提供了一种txt语音解决方案,其api能够为优秀的单词提供位置标记。这些信息可以在api的第四部分找到,可以在http://www.ispeech.org/api找到。想听听其他的解决方案。 干杯