我们试图让CMU Sphinx4只识别西班牙语中的“是”和“否”(si和no)。 我们用voxforge的西班牙语模型es_cont_2000实现了Sphinx4。 我们创建了语言模型(如下所示),当识别出“否”时,我们几乎100%准确。但是,当识别出“Si”(是)时,它只有大约50%。
除了调整语言模型(http://cmusphinx.sourceforge.net/wiki/tutorialadapt)之外,是否有人建议如何提高这类缩减词的准确度?
是否有更好的拉丁美洲西班牙语或其他方式的语言模型?
This is an ARPA-format language model file, generated by CMU Sphinx
\data\
ngram 1=4
ngram 2=4
ngram 3=4
\1-grams:
-0.7782 </s> -0.1761
-0.3010 <s> -0.5228
-0.7782 no -0.3978
-0.7782 si 0.0000
\2-grams:
-0.1761 </s> <s> -0.0791
-0.3978 <s> no 0.1761
-0.3978 <s> si -0.2217
-0.1761 no </s> 0.1761
\3-grams:
-0.3010 </s> <s> si
-0.3010 <s> no </s>
-0.3010 <s> si </s>
-0.3010 no </s> <s>
\end\
答案 0 :(得分:0)
您可以使用以下命令行:
for f in *.wav ; do echo $f; pocketsphinx_continuous -infile $f -hmm es_cont_2000 -jsgf es.jsgf -dict es.dic -lw 1.0 -logfn /dev/null; done
以下es.dic
si S I
no N O
以下jsgf语法:
#JSGF V1.0;
grammar sino;
public <sino> = si | no;
结果应该是:
no_andrea_converted.wav
000000000: no
no_dani_converted.wav
000000000: no
no_IM_converted.wav
000000000: no
si_andrea_converted.wav
000000000: si
si_dani_converted.wav
000000000: si
si_IM_converted.wav
000000000: si
您需要使用http://github.com/cmusphinx中最新的pocketsphinx和sphinxbase。 -lw 1.0
参数很重要。