需要用于Linux的文本到语音和语音识别工具

时间:2009-05-18 12:33:01

标签: linux speech-recognition text-to-speech

我打算为Linux编写一个使用文本到语音和语音识别的程序。有什么最好的工具/库?我应该使用Windows代替能够使用更好的工具吗?这些工具需要从控制台或C程序轻松调用。

12 个答案:

答案 0 :(得分:6)

对于语音识别,有各种Sphinxes。不同的变体有不同的优点和缺点,这里有一个比较Comparison of Sphinx versions。 Sphinx 4是Java,但其他的是C,我相信。

答案 1 :(得分:5)

这在很大程度上取决于你试图识别的是什么语言。

这是2005年的一篇文章,解释了创建听写计划的一些困难:http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html。如果你想这样,Julius语音识别引擎似乎很有希望,但你需要添加自己的声学和语言模型。您可以使用voxforge声学模型。

如果您不想编写听写程序,那么您可以轻松完成任务。指令程序的词汇量有限,例如“如果您想继续使用英语,请说”英语“。

使用pocketsphinx和gstreamer可以获得相当不错的结果a program自动编辑twitter播客中“TWiT”一词的大部分内容。在我根据播客的成绩单使用我自己的语言模型之前,它根本不起作用;来自语音识别器的机器转录是无用的/搞笑的,但他们可以找到关键字。

答案 2 :(得分:4)

我在linux下使用了LoquendoFestival。我会认为我用过的节日声音很差,非常机器人合成。另一方面,Loquendo的声音非常好 - 质量非常高。

答案 3 :(得分:4)

对于语音识别,Linux的存在很少。我只知道一个显然不错的选择,IBM几年前发布的东西,但后来不再可用(任何人都知道这个ViaVoice SDK是否仍然可以从任何地方获取?)。有关wikipedia的可能选项的更多信息。

答案 4 :(得分:0)

对于Debian / Ubuntu文本到语音,还有SVOX Pico:

sudo apt-get install libttspico-utils

答案 5 :(得分:-1)

我知道espeak是一个非常好的Linux文本到语音程序(它甚至可以做不同的重音!),但我不知道任何为UNIX设计的语音识别系统。

答案 6 :(得分:-1)

at&t fsm工具包也很棒 - 虽然不允许商业用途,

http://www.research.att.com/~fsmtools/fsm/

答案 7 :(得分:-1)

这有点旧,但我在几天前看到了关于Hackaday语音识别的相当全面的指南: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/

答案 8 :(得分:-1)

http://simon-listens.org/ - 西蒙开源语音/语音识别程序

答案 9 :(得分:-1)

然后有mbrola用于文本到语音。

答案 10 :(得分:-1)

您是否检查了基于HMM的语音合成的文本到语音转换。您可以在http://hts.sp.nitech.ac.jp/网站上找到免费演示。安装会有点繁琐。

答案 11 :(得分:-2)

最初的问题是关于找到合适的图书馆,我知道,但就使用语音识别而言,对于真正的听写而言,似乎没有什么可以用于Linux(尽管我确信它会及时改变,我怀疑它需要一段时间,因为我不确定很多人是否感兴趣。)

目前我正在尝试通过CodeWeavers推广Dragon NaturallySpeaking作为支持产品...所以如果您对用户感兴趣,那么如果您投票就会有所帮助......

http://www.codeweavers.com/compatibility/browse/name/?app_id=8427