标签: speech-synthesis
我想将文本转换为语音,并提供附带的元数据,以确定每个单词在其周期和周期中出现的间隔。所以"狗吃了#34;可能是
:开始0,结束.3s 狗:开始.5s,结束.8s 吃了:开始.11s,结束.14s
是否有将文本转换为语音的方法,并且除了通过生成的音频文件寻找暂停之外,还获得了此类数据。 干杯
答案 0 :(得分:0)