如何将mel频谱图转换为对数缩放的mel频谱图

时间:2018-02-08 18:45:22

标签: python audio speech-recognition spectrogram librosa

我正在阅读使用卷积神经网络的环境噪音歧视的this paper,并希望重现他们的结果。他们将WAV文件转换为对数缩放的mel谱图。你怎么做到这一点?我能够将WAV文件转换为mel光谱图

y, sr = librosa.load('audio/100263-2-0-117.wav',duration=3)
ps = librosa.feature.melspectrogram(y=y, sr=sr)
librosa.display.specshow(ps, y_axis='mel', x_axis='time')

mel spectrogram

我也可以显示它作为日志缩放光谱图:

librosa.display.specshow(ps, y_axis='log', x_axis='time')

log scaled image

显然,它们看起来不同,但实际的谱图ps是相同的。使用librosa,如何将此melspectrogram转换为日志缩放的melspectrogram?此外,原始缩放光谱图在原始光谱图上的用途是什么?是仅仅减少频域的方差使其与时间轴或其他东西相比?

1 个答案:

答案 0 :(得分:2)

librosa.power_to_db应该这样做,看一下