CMU Sphinx4:用西班牙语识别是/否

时间:2014-07-14 22:20:38

标签: sphinx4

我们试图让CMU Sphinx4只识别西班牙语中的“是”和“否”(si和no)。 我们用voxforge的西班牙语模型es_cont_2000实现了Sphinx4。 我们创建了语言模型(如下所示),当识别出“否”时,我们几乎100%准确。但是,当识别出“Si”(是)时,它只有大约50%。

除了调整语言模型(http://cmusphinx.sourceforge.net/wiki/tutorialadapt)之外,是否有人建议如何提高这类缩减词的准确度?

是否有更好的拉丁美洲西班牙语或其他方式的语言模型?

This is an ARPA-format language model file, generated by CMU Sphinx
\data\
ngram 1=4
ngram 2=4
ngram 3=4

\1-grams:
-0.7782 </s> -0.1761
-0.3010 <s> -0.5228
-0.7782 no -0.3978
-0.7782 si 0.0000

\2-grams:
-0.1761 </s> <s> -0.0791
-0.3978 <s> no 0.1761
-0.3978 <s> si -0.2217
-0.1761 no </s> 0.1761

\3-grams:
-0.3010 </s> <s> si 
-0.3010 <s> no </s> 
-0.3010 <s> si </s> 
-0.3010 no </s> <s> 

\end\

1 个答案:

答案 0 :(得分:0)

您可以使用以下命令行:

for f in *.wav ; do echo $f; pocketsphinx_continuous -infile $f -hmm es_cont_2000 -jsgf es.jsgf -dict es.dic -lw 1.0 -logfn /dev/null; done

以下es.dic

si S I
no N O

以下jsgf语法:

#JSGF V1.0;
grammar sino;
public <sino> = si | no;

结果应该是:

no_andrea_converted.wav
000000000: no
no_dani_converted.wav
000000000: no
no_IM_converted.wav
000000000: no
si_andrea_converted.wav
000000000: si
si_dani_converted.wav
000000000: si
si_IM_converted.wav
000000000: si

您需要使用http://github.com/cmusphinx中最新的pocketsphinx和sphinxbase。 -lw 1.0参数很重要。