标签: google-text-to-speech
Google Cloud的文本到语音WaveNet API的字符或单词转换率是多少?我想知道WaveNet生成的长音频文件的粗略时间戳。我什至可以使用一个粗略的估计。
答案 0 :(得分:0)
转换大约150个字符大约需要0.5s。
这就是我转换的块的大小。不能说多少是调用开销。即使用大量文本生成音频可能会更有效。