我能够通过8khz音频文件获得合理的准确度。现在我想尝试更高的采样率,如果可以的话。
查看this page上可用的声学模型,他们列出:
en-us-8khz.tar.gz
en-us-semi-full.tar.gz
en-us-semi.tar.gz
en-us.tar.gz
显示8khz的那个显然是8khz采样率的那个,但其他三个呢?它们匹配的采样率是多少?
如果我使用16khz音频文件,我需要使用哪种声学模型?
由于文件名中没有采样率,我如何计算出声学模型的采样率?
答案 0 :(得分:1)
您可以在模型文件夹中打开文件feat.params并查找-upperf
参数。在8khz模型-upperf
通常为3500或4000.对于16khz模型-upperf
超过4000,通常为6800。