Question

我能够通过8khz音频文件获得合理的准确度。现在我想尝试更高的采样率，如果可以的话。

查看this page上可用的声学模型，他们列出：

en-us-8khz.tar.gz     
en-us-semi-full.tar.gz  
en-us-semi.tar.gz  
en-us.tar.gz

显示8khz的那个显然是8khz采样率的那个，但其他三个呢？它们匹配的采样率是多少？

如果我使用16khz音频文件，我需要使用哪种声学模型？

由于文件名中没有采样率，我如何计算出声学模型的采样率？

Answer 1

您可以在模型文件夹中打开文件feat.params并查找-upperf参数。在8khz模型-upperf通常为3500或4000.对于16khz模型-upperf超过4000，通常为6800。