标签: c++ svm openal mfcc
我正在训练SVM以识别语音信号中的打击,并且训练的模型在wav输入文件上几乎以95%的准确度工作。我正在计算MFCC功能10ms帧,重叠5ms。
但是,如果我尝试在实时流上进行预测,我正在使用openAL读取声卡缓冲区,并且我获取的每个缓冲区内容都是30ms长,并且不知何故,这种输入的预测甚至不接近50%但另一方面,如果我在将音频输入馈送到SVM进行预测时记录音频输入,然后如果我检查这些记录数据的准确度,则再次95%。
我无法弄清楚在流音频的情况下造成这种差异的原因。任何帮助都会很棒。