标签: neural-network fft conv-neural-network
我一直在使用带有MFM激活功能的4层CNN来解决分类问题。当CNN的输入是音频信号的CQT(恒定q变换)+ FFT时,测试精度稳定在55%左右。相反,当输入是使用与上面计算的相同值绘制的频谱图时,测试精度为91%。有什么想法为什么会这样?