我打算为Linux编写一个使用文本到语音和语音识别的程序。有什么最好的工具/库?我应该使用Windows代替能够使用更好的工具吗?这些工具需要从控制台或C程序轻松调用。
答案 0 :(得分:6)
对于语音识别,有各种Sphinxes。不同的变体有不同的优点和缺点,这里有一个比较Comparison of Sphinx versions。 Sphinx 4是Java,但其他的是C,我相信。
答案 1 :(得分:5)
这在很大程度上取决于你试图识别的是什么语言。
这是2005年的一篇文章,解释了创建听写计划的一些困难:http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html。如果你想这样,Julius语音识别引擎似乎很有希望,但你需要添加自己的声学和语言模型。您可以使用voxforge声学模型。
如果您不想编写听写程序,那么您可以轻松完成任务。指令程序的词汇量有限,例如“如果您想继续使用英语,请说”英语“。
使用pocketsphinx和gstreamer可以获得相当不错的结果a program自动编辑twitter播客中“TWiT”一词的大部分内容。在我根据播客的成绩单使用我自己的语言模型之前,它根本不起作用;来自语音识别器的机器转录是无用的/搞笑的,但他们可以找到关键字。
答案 2 :(得分:4)
答案 3 :(得分:4)
对于语音识别,Linux的存在很少。我只知道一个显然不错的选择,IBM几年前发布的东西,但后来不再可用(任何人都知道这个ViaVoice SDK是否仍然可以从任何地方获取?)。有关wikipedia的可能选项的更多信息。
答案 4 :(得分:0)
对于Debian / Ubuntu文本到语音,还有SVOX Pico:
sudo apt-get install libttspico-utils
答案 5 :(得分:-1)
我知道espeak是一个非常好的Linux文本到语音程序(它甚至可以做不同的重音!),但我不知道任何为UNIX设计的语音识别系统。
答案 6 :(得分:-1)
at&t fsm工具包也很棒 - 虽然不允许商业用途,
答案 7 :(得分:-1)
这有点旧,但我在几天前看到了关于Hackaday语音识别的相当全面的指南: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/
答案 8 :(得分:-1)
http://simon-listens.org/ - 西蒙开源语音/语音识别程序
答案 9 :(得分:-1)
然后有mbrola用于文本到语音。
答案 10 :(得分:-1)
您是否检查了基于HMM的语音合成的文本到语音转换。您可以在http://hts.sp.nitech.ac.jp/网站上找到免费演示。安装会有点繁琐。
答案 11 :(得分:-2)
最初的问题是关于找到合适的图书馆,我知道,但就使用语音识别而言,对于真正的听写而言,似乎没有什么可以用于Linux(尽管我确信它会及时改变,我怀疑它需要一段时间,因为我不确定很多人是否感兴趣。)
目前我正在尝试通过CodeWeavers推广Dragon NaturallySpeaking作为支持产品...所以如果您对用户感兴趣,那么如果您投票就会有所帮助......
http://www.codeweavers.com/compatibility/browse/name/?app_id=8427