我有一个使用Android TTS API将文本转录为音频的类。我可以控制音高和速度;但我注意到引擎需要一个文本字符串和一个哈希对象。我注意到一些单词发音太快而不易被识别,并且拐点似乎太不自然了。有没有办法控制这两件事;可能通过HashMap
?以下是我使用引擎的方式:
mTts = new TextToSpeech(Globals.context, this); // context, listener
}
@Override
public void onInit(int status) {
HashMap<String, String> myHashRender = new HashMap();
myHashRender.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID, speech);
mTts.setPitch(0.8f);
mTts.setSpeechRate(0.6f);
mTts.synthesizeToFile(speech, myHashRender, fileOutPath);
while (mTts.isSpeaking()) try {
Thread.sleep(100);
} catch (InterruptedException e) {
e.printStackTrace();
}
mTts.stop();
mTts.shutdown();
答案 0 :(得分:4)
Google TTS目前不支持此功能,但您可以执行以下操作:在解析文本时,您可以更改部分内容以获得所需的语调和变形。
例如,如果您遇到“嘿嘿”这个词。你把它改写成了“Heeeey&#39;在将它发送到TTS引擎以获得不同的发音之前。
它不漂亮,但它是一种解决方法。
答案 1 :(得分:3)
Google TTS目前不支持更改变形,也不支持 支持SSML中定义的内联韵律标签。 - alanv Jun 5 at 20:30
答案 2 :(得分:0)