创建TTS包

时间:2010-07-02 09:39:52

标签: text-to-speech

如何创建TTS语音包?

我有一个小应用程序将文本转换为speach,现在我正在使用microsoft的内置tts包来执行文本演讲,但是,我想让专业的语音艺术家创建一个新的文本来演讲语音包。问题是,我不知道如何创建声音包(TTS)

1 个答案:

答案 0 :(得分:6)

为文字转语音引擎创建新语音是一个复杂的过程。这不仅仅是让一个声音艺术家录制音频并简单地创建一个声音。这有很多工作要做(将音频分成音素;构建语音数据;构建字典;使韵律和音频连接/合成规则正确)。

对于像Microsoft文字转语音引擎这样的语音引擎,您还面临着语音格式是专有的问题,因此您无法以该格式创建新的语音。您也受到引擎功能的限制。

目前最好的选择是:

  1. 切换到使用eSpeak文字转语音引擎并使用espeakedit创建自己的语音(联系开发人员寻求帮助) - 此引擎使用合成方法,使其听起来类似于微软和语音斯蒂芬霍金正在使用,但他们非常清楚,发音总体来说非常好;
  2. 使用像Cepstral这样使用录音的不同文字转语音引擎(这听起来更像人类,但我发现韵律不是很好,破坏了产生的音频);
  3. 使用Cepstral提供的服务创建特定于您需求的语音(这可能很昂贵)。
  4. 我正在研究使用librivox.org的音频数据来生成文本到语音的声音。这可能是3到3年之后,在我有任何接近功能之前。