应用错误收集

为文字转语音引擎创建新语音是一个复杂的过程。这不仅仅是让一个声音艺术家录制音频并简单地创建一个声音。这有很多工作要做（将音频分成音素;构建语音数据;构建字典;使韵律和音频连接/合成规则正确）。

对于像Microsoft文字转语音引擎这样的语音引擎，您还面临着语音格式是专有的问题，因此您无法以该格式创建新的语音。您也受到引擎功能的限制。

目前最好的选择是：

切换到使用eSpeak文字转语音引擎并使用espeakedit创建自己的语音（联系开发人员寻求帮助） - 此引擎使用合成方法，使其听起来类似于微软和语音斯蒂芬霍金正在使用，但他们非常清楚，发音总体来说非常好;
使用像Cepstral这样使用录音的不同文字转语音引擎（这听起来更像人类，但我发现韵律不是很好，破坏了产生的音频）;
使用Cepstral提供的服务创建特定于您需求的语音（这可能很昂贵）。

我正在研究使用librivox.org的音频数据来生成文本到语音的声音。这可能是3到3年之后，在我有任何接近功能之前。