将窗口函数应用于librosa中的帧

时间:2016-12-28 00:20:47

标签: python audio speech-recognition librosa

我目前正在研究ASR系统,我忘了对每个帧应用窗口函数。我正在提取,这可能是我收到不良结果的原因。但这可能在librosa吗?

我在librosa文档中找不到这个选项。

我需要在每个帧上应用汉明窗口,这些窗口都是这样提取的。

   for fp in file_paths:
        y,sr = librosa.load(fp,sr=16000)
        X = librosa.util.frame(y, frame_length=400, hop_length=160)

1 个答案:

答案 0 :(得分:2)

Librosa雇佣了scipy.signal:

window = scipy.signal.hann(win_length, sym=False)

# Reshape so that the window can be broadcast
window = window.reshape((-1, 1))

windowed = fft_window * X

Here你可以看到它是如何在librosa中完成的。

但为什么不使用librosa.stftlibrosa.mfcc?它会做你需要的一切。