应用傅里叶变换后scipy.io波形文件处理的问题

时间:2013-03-24 06:48:00

标签: python scipy fft wav wave

我正在使用scipy.fftpack和scipy.io包在Python中处理一些音频文件。这意味着我有我正在导入的波形文件,使用傅里叶变换玩它们,然后输出到新的波形文件。然而,我遇到了一些问题,在运行这些变换之后,波形文件将无法播放,大约是原始文件大小的4倍。

目前我只是导入歌曲,获取速率,导入数据,执行ifft(fft(数据))然后输出。我已经尝试获取这些浮点值并将其转换为整数并计算初始导入数据和ifft(fft(数据))之间的差异,并看到它正好为零。

以下是我的问题:

  1. 有谁知道为什么我在进行傅里叶变换后尝试播放的wave文件无法播放?

  2. 对波浪文件是否有任何限制可能导致一般问题。或者数据必须是整数吗?

  3. 现在已经很晚了,我觉得我的帖子可能会分散,所以如果您需要更多信息,请询问,我会尽力给出更好的描述。

1 个答案:

答案 0 :(得分:4)

您需要在处理后将数据转换为适当位深度的整数类型。以this file为例:

>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('Happy Tree Friends.wav')
>>> rate
8000
>>> data
array([ 5, -5,  5, ...,  0, -1,  0], dtype=int16)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([  5.00000000e+00 -1.55406753e-11j,
        -5.00000000e+00 +1.95349676e-11j,
         5.00000000e+00 +1.41131140e-11j, ...,
         8.06674092e-12 -7.58643463e-13j,
        -1.00000000e+00 -2.21611283e-12j,  -2.04999489e-11 +4.55890751e-12j])
>>> data_bis.dtype
dtype('complex128')

即使data中的值与data_bis中的值非常接近,但它们是非常不同的野兽,如下所示:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis)
>>> scipy.io.wavfile.read('test.wav')
TypeError: data type not understood

但是如果您只是将处理后的结果转换回原来的dtype,那么一切都会很好地运作:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis.astype(data.dtype))
__main__:1: ComplexWarning: Casting complex values to real discards the imaginary part
>>> scipy.io.wavfile.read('test.wav')
(8000, array([ 4, -5,  4, ...,  0, -1,  0], dtype=int16))