我想用冲激响应对语音文件进行卷积。
平均而言,语音文件的持续时间为10秒。我正在尝试使用numpy
或scipy
库进行卷积。
尝试时出现内存错误!很抱歉,我无法在此处提供语音文件和冲动响应。请使用任何音频文件进行检查。
import numpy as np
convolved_speech_data = np.convolve(speech_data, impulse_response)
我遇到以下错误。
return multiarray.correlate(a, v[::-1], mode)
MemoryError
Process finished with exit code 1
我不知道为什么会引发错误,在卷积之前我是否需要对音频进行规范化?还是必须使用窗口化?