CMU Sphinix对于识别现场演讲太慢了。我不知道你是否有任何提升它的想法?
这是我的配置:
configuration.setAcousticModelPath("WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz");
configuration.setDictionaryPath("cmudict.0.6d");
configuration.setLanguageModelPath("en-us.lm.dmp");
答案 0 :(得分:3)
我们目前正致力于加速,但目前sphinx4并不适用于大词汇量。这实际上不是一项微不足道的任务。
如果你想要一个快速而不是非常准确的转录,你可以在sphinx4源代码中编辑default.config.xml并重新编译:
<property name="absoluteBeamWidth" value="10000"/>
<property name="relativeBeamWidth" value="1e-60"/>
<property name="absoluteWordBeamWidth" value="50"/>
<property name="relativeWordBeamWidth" value="1e-40"/>
然后它会实时工作。