应用错误收集

关键字识别器与窄带语音信号不兼容。怎么解决？

时间：2016-07-15 03:00:05

标签： signal-processing speech-recognition cmusphinx

这就是我所拥有的：

要在关键字监视器中使用的声学模型（CMU Sphinx）。训练以16kHz采样的语音并表现良好。当提供8kHz采样的语音信号或最大带宽为4kHz且采样率= 16kHz的语音信号时，表现不佳。
仅提供窄带信号的麦克风。信号带宽最大为4kKz。我可以将采样率（音频驱动程序API）设置为16kHz，但是从底层开始，带宽保持不变硬件采样频率为8kHz。无法改变！

结果如下：

关键字spotter在显示语音信号（采样率16kHz）时失败带宽为4kHz。

这是我的问题：如果我通过带宽“伪造”它，那么期望关键字spotter能够正常工作是否合理？在将窄带信号发送到关键字监视器之前扩展窄带信号？

什么是最简单的BW扩展器？（我正在寻找可以快速实施的东西）。

由于

1 个答案:

答案 0 :(得分：1)

有8khz型号，您应该使用它们。

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/cmusphinx-en-us-ptm-8khz-5.2.tar.gz