pocketsphinx python给出了错误的时间戳

时间:2017-04-26 12:28:40

标签: python speech-recognition cmusphinx pocketsphinx

我使用pocketsphinx将音频转换为文本。它工作正常。现在我想得到每个单词的时间戳。这是我的代码:

f(x) = k*log(x) + m

根据他们的文档,默认帧率为100.我得到了每个单词的开始时间。但是,这是不正确的。差异是2秒,有时超过3秒。

已知问题或我错过了什么?

1 个答案:

答案 0 :(得分:1)

我在某个地方看到费率为1/100因此,我的项目偶然分开1/10而不是1/100,但结果实际上对我正在做的事情很好。我建议除以0.10.01,看看它为您提供了什么。

因此,对于您的代码,只需尝试这些变量:

framerate = .1 

OR

framerate = .01