如何从声音到频谱然后再回到python中的声音?

时间:2016-01-10 19:45:50

标签: python audio fft

如何获取wav文件,每隔几毫秒将其转换为频率强度数组,对该数组执行某些操作,然后将该新数组转换回wav文件。

是否有一个看起来像这样的库

wav_data = library.read_wav('aoeu.wav') # [0, 3, 201, ... etc]

spectrum = library.get_spectrum(wav_data)  
# [[0, 0, 0, .2, 0, .7, ... etc], 
#  [0, 0, 0, .3, 0, .8, ... etc],
#  ... etc] 

spectrum[:, 0] = 0 # kill the lowest frequency (assuming spectrum is a numpy array)

library.spectrum_to_wav(spectrum) # [0, 3, 201, ... etc]

1 个答案:

答案 0 :(得分:3)

使用librosa.stftlibrosa.istft并使用librosa.load

阅读音频文件
import librosa

audio, sample_rate = librosa.load('song.wav')

spectrum = librosa.stft(audio)
reconstructed_audio = librosa.istft(spectrum)

sum(audio[:len(reconstructed_audio)] - reconstructed_audio)  # very close to 0

我使用audio[:len(reconstructed_audio)]因为信息在转换中丢失了。 istft(stft(foo))可以返回比foo略短的数组,并且值略有不同。