在我的休息时间,我是超级英雄,我正在尝试构建一个分析语音关键词的应用程序。 (想想紧急/ 911电话)如果关键字是“抢劫”,并且在提供的音频中说出了该字,我想标记该文件并可能将其翻译成文本。
有哪些开发库或软件应用程序用于执行此类操作?首选C ++或Java库,但不是必需的。
答案 0 :(得分:1)
Wiki页面here是一个很好的起点。在那里提到的那些我认为CMU Sphinx是最活跃的。
答案 1 :(得分:1)
你可以和Praat http://www.fon.hum.uva.nl/praat/合作,这是一个与语音学合作的优秀程序,它有自己的脚本语言。您还可以在Praat社区中找到许多脚本。您还可以使用sendpraat http://www.fon.hum.uva.nl/praat/sendpraat.html将praat函数作为子例程使用。