我有一个音频文件,其中包含视频的独白。我不喜欢别人的声音,因此我想将其转换为Google Cloud Text-To-Speech声音,特别是en-GB女性声音。
我能够使用API创建语音文本json文件,但是json文件的输出格式与文本语音API所使用的输入json格式不兼容。
有没有办法将Google语音到文本引擎的输出桥接到他们的文本到语音引擎?
答案 0 :(得分:0)
显然没有办法自动执行此操作。
我想到的一件事是创建一个简单的脚本来获取语音到文本API的输出,然后如果您打算通常执行此操作,则格式化文本到语音API的输入,如果不是这样,那么最简单的事情就是将“语音到文本” API的输出复制并粘贴到“文本到语音” API。