Question

我已经阅读了几天，但一直没有找到解决方案...我能够使用以下方法构建 Librosa 频谱图并提取幅度/频率数据：

audio, sr = librosa.load('short_piano melody_keyCmin_110bpm.wav', sr = 22500)
spectrum = librosa.stft(audio, n_fft=2048, window=scipy.signal.windows.hamming)
D = librosa.amplitude_to_db(np.abs(spectrum), ref=np.max)
n = D.shape[0]
Nfft = 1+2*(n-1)
freq_bins = librosa.fft_frequencies(sr=sr, n_fft=Nfft)

但是，我无法将 D 和 freq_bins 中的数据转换回频谱。一旦我能够做到这一点，我就可以将新频谱转换为 .wav 文件并收听我重建的音频...任何建议将不胜感激！谢谢。

Answer 1

当我正确回答您的问题时，您想根据您的幅度值重建实部/虚部频谱。您将需要相位分量，然后是所有简单的复数算术。你应该知道，STFT的输出是复数数组，幅度是每个数字的绝对值，而相位是每个数字的角度

这是一个将时域信号转换为幅度/相位并返回而不修改它的示例：

% get the complex valued spectrum from a sample
spectrum = librosa.stft(audio, n_fft=2048,window=scipy.signal.windows.hamming) 

# get magnitude and phase from the complex numbers
magnitude = np.abs(spectrum)
phase = np.angle(spectrum)

# reconstruct real/imaginary parts from magnitude and phase
spectrum = magnitude * np.exp(1j*phase)

# transform back to time-domain

在您的情况下，您当然应该首先将 db 值转换回幅度值。即使没有使用 librosa 的经验，我相信也有一个功能。

Librosa - 音频频谱图/频率箱到频谱

1 个答案: