这就是我所拥有的:
要在关键字监视器中使用的声学模型(CMU Sphinx)。训练以16kHz采样的语音并表现良好。当提供8kHz采样的语音信号或最大带宽为4kHz且采样率= 16kHz的语音信号时,表现不佳。
仅提供窄带信号的麦克风。信号带宽最大为4kKz。我可以将采样率(音频驱动程序API)设置为16kHz,但是从底层开始,带宽保持不变 硬件采样频率为8kHz。无法改变!
结果如下:
关键字spotter在显示语音信号(采样率16kHz)时失败 带宽为4kHz。
这是我的问题: 如果我通过带宽“伪造”它,那么期望关键字spotter能够正常工作是否合理? 在将窄带信号发送到关键字监视器之前扩展窄带信号?
什么是最简单的BW扩展器? (我正在寻找可以快速实施的东西)。
由于
答案 0 :(得分:1)