Question

我打算为Linux编写一个使用文本到语音和语音识别的程序。有什么最好的工具/库？我应该使用Windows代替能够使用更好的工具吗？这些工具需要从控制台或C程序轻松调用。

Answer 1

对于语音识别，有各种Sphinxes。不同的变体有不同的优点和缺点，这里有一个比较Comparison of Sphinx versions。 Sphinx 4是Java，但其他的是C，我相信。

Answer 2

这在很大程度上取决于你试图识别的是什么语言。

这是2005年的一篇文章，解释了创建听写计划的一些困难：http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html。如果你想这样，Julius语音识别引擎似乎很有希望，但你需要添加自己的声学和语言模型。您可以使用voxforge声学模型。

如果您不想编写听写程序，那么您可以轻松完成任务。指令程序的词汇量有限，例如“如果您想继续使用英语，请说”英语“。

使用pocketsphinx和gstreamer可以获得相当不错的结果a program自动编辑twitter播客中“TWiT”一词的大部分内容。在我根据播客的成绩单使用我自己的语言模型之前，它根本不起作用;来自语音识别器的机器转录是无用的/搞笑的，但他们可以找到关键字。

Answer 3

我在linux下使用了Loquendo和Festival。我会认为我用过的节日声音很差，非常机器人合成。另一方面，Loquendo的声音非常好 - 质量非常高。

Answer 4

对于语音识别，Linux的存在很少。我只知道一个显然不错的选择，IBM几年前发布的东西，但后来不再可用（任何人都知道这个ViaVoice SDK是否仍然可以从任何地方获取？）。有关wikipedia的可能选项的更多信息。

Answer 5

对于Debian / Ubuntu文本到语音，还有SVOX Pico：

sudo apt-get install libttspico-utils

Answer 6

我知道espeak是一个非常好的Linux文本到语音程序（它甚至可以做不同的重音！），但我不知道任何为UNIX设计的语音识别系统。

Answer 7

at＆t fsm工具包也很棒 - 虽然不允许商业用途，

Answer 8

这有点旧，但我在几天前看到了关于Hackaday语音识别的相当全面的指南： http://hackaday.com/2010/07/09/get-started-with-speech-recognition/

Answer 9

http://simon-listens.org/ - 西蒙开源语音/语音识别程序

Answer 10

然后有mbrola用于文本到语音。

Answer 11

您是否检查了基于HMM的语音合成的文本到语音转换。您可以在http://hts.sp.nitech.ac.jp/网站上找到免费演示。安装会有点繁琐。

Answer 12

最初的问题是关于找到合适的图书馆，我知道，但就使用语音识别而言，对于真正的听写而言，似乎没有什么可以用于Linux（尽管我确信它会及时改变，我怀疑它需要一段时间，因为我不确定很多人是否感兴趣。）

目前我正在尝试通过CodeWeavers推广Dragon NaturallySpeaking作为支持产品...所以如果您对用户感兴趣，那么如果您投票就会有所帮助......