我对音频处理非常陌生。所以请原谅我的无知。
根据维基百科,通常x轴表示时间,y轴表示频率,反之亦然。颜色强度表示特定时间和频率的幅度(能量)。这很容易理解。
我无法解释pylab API中specgram
生成的频谱图。
上图分别绘制了具有不同窗口大小(128,512,1024)的图表。很明显,x轴是频率。 y轴上0到1.0之间的值代表什么?
如果有人能够对此有所了解,我真的很感激。
答案 0 :(得分:3)
从观察图像,以及波形图和频谱图之间的相关性来看,你认为x轴是频率是不正确的。
x轴是时间。我猜它是在样本中测量的。目前还不清楚为什么频谱图的x标签是时域图的一半。
彩色频谱图上的y轴是频率,最可能从0到奈奎斯特(半采样率)归一化。例如,假设8000Hz采样率,y轴[0.0,1.0] - > [0.0Hz,4000Hz]