我使用pocketsphinx将音频转换为文本。它工作正常。现在我想得到每个单词的时间戳。这是我的代码:
f(x) = k*log(x) + m
根据他们的文档,默认帧率为100.我得到了每个单词的开始时间。但是,这是不正确的。差异是2秒,有时超过3秒。
已知问题或我错过了什么?
答案 0 :(得分:1)
我在某个地方看到费率为1/100
因此,我的项目偶然分开1/10
而不是1/100
,但结果实际上对我正在做的事情很好。我建议除以0.1
或0.01
,看看它为您提供了什么。
因此,对于您的代码,只需尝试这些变量:
framerate = .1
OR
framerate = .01