我的Windows XP系统安装了Sphinx-4并设置了JSAPI。我想将英语口语WAV(或MP3)文件转录成文本。
当我运行"WavFile" demo时 - 它成功运行。
java -jar WavFile.jar
但是,当我像这样传递自己的wav文件时:
java -jar WavFile.jar c:\test.wav
我明白了:
加载'jar:file:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml'中定义的识别器...
解码jar:文件:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五
似乎这个演示设置为加载并运行内部wav文件(“12345.wav”)或其他东西。
我已经阅读了文档,无法想象如何设置“config.xml”,甚至无法设置放置它的目录。我只是试图使用标准演示获得一个简单的概念证明。
所以,问题是:如何运行Sphinx4程序来转录wav文件?
感谢。
答案 0 :(得分:6)
需要编写一个使用CMU Dictionary(美国英语)而不是Transcriber.jar支持的数字的新应用程序(基于Transcriber.java)。
很奇怪Sphinx没有这么有用的样本。
答案 1 :(得分:1)
不确定您是否还需要答案。但我认为这个链接是你想要的(但只适用于数字数据): http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html
答案 2 :(得分:1)
我知道这是一个超级老线程,但我只想指出你的例子似乎运行得很好。如果你看一下输出的最后一部分:
解码jar:文件:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav结果:一二三四五< ==========解码WAV音频的结果!
答案 3 :(得分:0)
看看pocketsphinx包。它是用C语言编写的,已经为每个平台编译,可以用作命令行或作为应用程序的一部分。我一直在使用命令行,它非常通用。