音频样本库(口头文本)

时间:2008-09-27 11:12:12

标签: audio text-to-speech

对于我们目前正在开展的项目,我们需要一个包含多种语言的口语单词库。

两种选择似乎是可能的:母语人士的文字转语音或“真实”录音。由于质量对我们很重要,我们正在考虑采用后一种方式。

为了为我们的应用程序创建原型,我们正在寻找包含尽可能多的不同语言的单词的库。为了了解我们的方法的质量,这个库不应该由合成语音组成。

您知道任何可用/可访问的库吗?

5 个答案:

答案 0 :(得分:3)

一位同事刚刚找到了这个基于社区的库,这个很好,但是体积很小:

Forvo.com

答案 1 :(得分:0)

我刚发现这个on the Audacity wikiVoxForge。从他们的网站:

  

VoxForge的设立是为了收集转录语音,用于免费和开源语音识别引擎(在Linux,Windows和Mac上)。

     

我们将在GPL许可下提供所有提交的音频文件,然后将它们“编译”成声学模型,用于开源语音识别引擎,如Sphinx,ISIP,Julius和HTK(注意:HTK有分发限制) 。

答案 2 :(得分:0)

还有Old time radio,不确定这是否是您所说的那种口语。

答案 3 :(得分:0)

我的猜测是,你不会在任何只包含单个单词的地方找到一个图书馆。无论你发现什么,你都必须在编辑器(如Pro Tools或Cool Edit)中打开音频并将其整理成单个单词。

您可能最好创建一个包含每种语言所需的所有单词的列表,然后在录制时找到母语人士阅读它们。你可以慢慢阅读它们,这样你就可以很容易地把每个单词都砍掉。

答案 4 :(得分:-1)

我经常使用的一个:http://shtooka.net/index.php 轻松访问录音。