狮身人面像4转录时间指数

时间:2013-09-27 01:32:52

标签: cmusphinx sphinx4

当我将其设置为转录音频文件时,如何在Sphinx 4中获取时间索引(或帧编号)?

我正在使用的代码如下:

audioURL = ...
AudioFileDataSource dataSource = (AudioFileDataSource) cm.lookup("audioFileDataSource");
dataSource.setAudioFile(audioURL, null);

Result result;
while ((result = Recognizer.recognize()) != null) {
  Token token = result.getBestToken();
  //DoubleData data = (DoubleData) token.getData();
  //long frameNum = data.getFirstSampleNumber(); // data seem always null
  String resultText = token.getWordPath(false, false);
  ...
}

我试图从结果/令牌对象中获取转录时间,例如类似于字幕做的。我找到了Result.getFrameNumber()和Token.getFrameNumber()但它们似乎返回了解码的帧数,而不是在整个音频文件的上下文中找到结果的时间(或帧)。

我查看了AudioFileDataSource.getDuration()[= private]和Recognizer类,但还没弄清楚如何获得所需的转录时间索引..

想法? :)

1 个答案:

答案 0 :(得分:1)

帧数是时间乘以帧速率,即100帧/秒。

无论如何,请找到字幕演示的补丁,它会返回时间:

http://sourceforge.net/mailarchive/forum.php?thread_name=1380033926.26218.12.camel%40localhost.localdomain&forum_name=cmusphinx-devel

该补丁适用于subversion trunk,而不适用于1.0-beta版本。

请注意,此部分正在进行重大重构,因此API很快就会过时。但是,我希望你能够在没有当前复杂性的情况下用很少的电话创建字幕。