Question

我有一个使用Android TTS API将文本转录为音频的类。我可以控制音高和速度;但我注意到引擎需要一个文本字符串和一个哈希对象。我注意到一些单词发音太快而不易被识别，并且拐点似乎太不自然了。有没有办法控制这两件事;可能通过HashMap？以下是我使用引擎的方式：

    mTts = new TextToSpeech(Globals.context, this); // context, listener
}

@Override
public void onInit(int status) {
    HashMap<String, String> myHashRender = new HashMap();
    myHashRender.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID, speech);
    mTts.setPitch(0.8f);
    mTts.setSpeechRate(0.6f);
    mTts.synthesizeToFile(speech, myHashRender, fileOutPath);
    while (mTts.isSpeaking()) try {
        Thread.sleep(100);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    mTts.stop();
    mTts.shutdown();

Answer 1

Google TTS目前不支持此功能，但您可以执行以下操作：在解析文本时，您可以更改部分内容以获得所需的语调和变形。

例如，如果您遇到“嘿嘿”这个词。你把它改写成了“Heeeey＆＃39;在将它发送到TTS引擎以获得不同的发音之前。

它不漂亮，但它是一种解决方法。

Answer 2

Google TTS目前不支持更改变形，也不支持支持SSML中定义的内联韵律标签。 - alanv Jun 5 at 20:30

Answer 3

Google TTS目前不支持更改变形，也不支持SSML中定义的内联韵律标记。虽然您可以设置参数，但它们都不能控制变形或每个词的韵律。

可能还有其他引擎支持这些功能。例如，eSpeak支持SSML标记，并且在Play商店中提供了一个Android端口。

如何控制Android TTS播放音频的方式

3 个答案: