关键字识别器与窄带语音信号不兼容。怎么解决?

时间:2016-07-15 03:00:05

标签: signal-processing speech-recognition cmusphinx

这就是我所拥有的:

  1. 要在关键字监视器中使用的声学模型(CMU Sphinx)。训练以16kHz采样的语音并表现良好。当提供8kHz采样的语音信号或最大带宽为4kHz且采样率= 16kHz的语音信号时,表现不佳。

  2. 仅提供窄带信号的麦克风。信号带宽最大为4kKz。我可以将采样率(音频驱动程序API)设置为16kHz,但是从底层开始,带宽保持不变 硬件采样频率为8kHz。无法改变!

  3. 结果如下:

    关键字spotter在显示语音信号(采样率16kHz)时失败 带宽为4kHz。

    这是我的问题: 如果我通过带宽“伪造”它,那么期望关键字spotter能够正常工作是否合理? 在将窄带信号发送到关键字监视器之前扩展窄带信号?

    什么是最简单的BW扩展器? (我正在寻找可以快速实施的东西)。

    由于