有哪些库可用于分析口头关键词和/或语音到文本的音频文件?

时间:2011-02-02 22:39:57

标签: java c++ language-agnostic audio analysis

在我的休息时间,我是超级英雄,我正在尝试构建一个分析语音关键词的应用程序。 (想想紧急/ 911电话)如果关键字是“抢劫”,并且在提供的音频中说出了该字,我想标记该文件并可能将其翻译成文本。

有哪些开发库或软件应用程序用于执行此类操作?首选C ++或Java库,但不是必需的。

2 个答案:

答案 0 :(得分:1)

Wiki页面here是一个很好的起点。在那里提到的那些我认为CMU Sphinx是最活跃的。

答案 1 :(得分:1)

你可以和Praat http://www.fon.hum.uva.nl/praat/合作,这是一个与语音学合作的优秀程序,它有自己的脚本语言。您还可以在Praat社区中找到许多脚本。您还可以使用sendpraat http://www.fon.hum.uva.nl/praat/sendpraat.html将praat函数作为子例程使用。