当我将其设置为转录音频文件时,如何在Sphinx 4中获取时间索引(或帧编号)?
我正在使用的代码如下:
audioURL = ...
AudioFileDataSource dataSource = (AudioFileDataSource) cm.lookup("audioFileDataSource");
dataSource.setAudioFile(audioURL, null);
Result result;
while ((result = Recognizer.recognize()) != null) {
Token token = result.getBestToken();
//DoubleData data = (DoubleData) token.getData();
//long frameNum = data.getFirstSampleNumber(); // data seem always null
String resultText = token.getWordPath(false, false);
...
}
我试图从结果/令牌对象中获取转录时间,例如类似于字幕做的。我找到了Result.getFrameNumber()和Token.getFrameNumber()但它们似乎返回了解码的帧数,而不是在整个音频文件的上下文中找到结果的时间(或帧)。
我查看了AudioFileDataSource.getDuration()[= private]和Recognizer类,但还没弄清楚如何获得所需的转录时间索引..
想法? :)
答案 0 :(得分:1)
帧数是时间乘以帧速率,即100帧/秒。
无论如何,请找到字幕演示的补丁,它会返回时间:
该补丁适用于subversion trunk,而不适用于1.0-beta版本。
请注意,此部分正在进行重大重构,因此API很快就会过时。但是,我希望你能够在没有当前复杂性的情况下用很少的电话创建字幕。