应用错误收集

Python | librosa：如何从音频wav文件中提取人声？

时间：2018-01-04 06:36:30

标签： python audio fft voice librosa

鉴于人类通话录音的wav文件（单声道16KHz采样率），有没有办法只提取声音，从而滤除大部分机械和背景噪音？我尝试在Python 3.6中使用librosa包，但无法弄清piptrack如何工作（或者如果有更简单的方法）。

尝试使用fft / ifft将频率限制为300-3400 range时，产生的声音严重失真。

sr, y = scipy.io.wavfile.read(wav_file_path)
x = np.fft.rfft(y)[0:3400]
x[0:300] = 0
x = np.fft.irfft(x)

0 个答案:

没有答案