应用错误收集

时间：2008-09-27 11:12:12

标签： audio text-to-speech

对于我们目前正在开展的项目，我们需要一个包含多种语言的口语单词库。

两种选择似乎是可能的：母语人士的文字转语音或“真实”录音。由于质量对我们很重要，我们正在考虑采用后一种方式。

为了为我们的应用程序创建原型，我们正在寻找包含尽可能多的不同语言的单词的库。为了了解我们的方法的质量，这个库不应该由合成语音组成。

您知道任何可用/可访问的库吗？

答案 0 :(得分：3)

一位同事刚刚找到了这个基于社区的库，这个很好，但是体积很小：

答案 1 :(得分：0)

我刚发现这个on the Audacity wiki：VoxForge。从他们的网站：

VoxForge的设立是为了收集转录语音，用于免费和开源语音识别引擎（在Linux，Windows和Mac上）。

我们将在GPL许可下提供所有提交的音频文件，然后将它们“编译”成声学模型，用于开源语音识别引擎，如Sphinx，ISIP，Julius和HTK（注意：HTK有分发限制）。

答案 2 :(得分：0)

还有Old time radio，不确定这是否是您所说的那种口语。

答案 3 :(得分：0)

我的猜测是，你不会在任何只包含单个单词的地方找到一个图书馆。无论你发现什么，你都必须在编辑器（如Pro Tools或Cool Edit）中打开音频并将其整理成单个单词。

您可能最好创建一个包含每种语言所需的所有单词的列表，然后在录制时找到母语人士阅读它们。你可以慢慢阅读它们，这样你就可以很容易地把每个单词都砍掉。

答案 4 :(得分：-1)

我经常使用的一个：http://shtooka.net/index.php 轻松访问录音。