Question

我正在尝试使用Python的NumPy库进行一些频率分析。我有两个都包含440 Hz正弦波的.wav文件。其中一个我使用NumPy正弦函数生成，另一个我使用Audacity生成。 FFT适用于Python生成的FFT，但不适用于Audacity的

。

这是两个文件的链接：

无效文件：440_audacity.wav

工作文件：440_gen.wav

这是我用来进行傅立叶变换的代码：

import numpy as np
import matplotlib.pyplot as plt
import scipy.io.wavfile as wave

infile = "440_gen.wav"
rate, data = wave.read(infile)

data = np.array(data)

data_fft = np.fft.fft(data)
frequencies = np.abs(data_fft)

plt.subplot(2,1,1)
plt.plot(data[:800])
plt.title("Original wave: " + infile)

plt.subplot(2,1,2)
plt.plot(frequencies)
plt.title("Fourier transform results")

plt.xlim(0, 1000)

plt.tight_layout()

plt.show()

我有两个16位PCM .wav文件，一个来自Audacity，另一个是使用NumPy正弦函数创建的。 NumPy生成的结果给出以下（正确）结果，峰值为440Hz：

我用Audacity创建的波形虽然看起来相同，但是在傅立叶变换上没有任何结果：

我承认我在这里不知所措。这两个文件实际上应包含相同的数据。它们以相同的方式编码，并且波形在上图上看起来相同。

以下是用于生成工作文件的代码：

import numpy as np
import wave
import struct
import matplotlib.pyplot as plt
from operator import add

freq_one = 440.0
num_samples = 44100
sample_rate = 44100.0
amplitude = 12800

file = "440_gen.wav"

s1 = [np.sin(2 * np.pi * freq_one * x/sample_rate) * amplitude for x in range(num_samples)]

sine_one = np.array(s1)

nframes = num_samples
comptype = "NONE"
compname="not compressed"
nchannels = 1
sampwidth = 2

wav_file = wave.open(file, 'w')
wav_file.setparams((nchannels, sampwidth, int(sample_rate), nframes, comptype, compname))

for s in sine_one:
    wav_file.writeframes(struct.pack('h', int(s)))

Answer 1

让我解释一下为什么您的代码不起作用。以及为什么它适用于 [:44100]。

首先，你有不同的文件：

440_gen.wav      = 1 sec and 44100  samples (counts)        
440_audacity.wav = 5 sec and 220500 samples (counts)

由于对于 FFT 中的 440_gen.wav，您使用参考点数 N=44100 和采样率 44100，因此您的频率分辨率为 1 Hz（以 1 Hz 为增量跟随 bin）。
因此，在图表上，每个 FFT 样本对应于等于 1 Hz 的增量。
plt.xlim(0, 1000) 仅对应于 0-1000 Hz 的范围。

但是，对于 FFT 中的 440_audacity.wav，您使用参考点数 N=220500 和采样率 44100。您的频率分辨率为 0.2 Hz（分档以 0.2 Hz 增量跟随） - 在图表上，每个FFT 样本对应于以 0.2 Hz 为增量的频率（min-max = +(-) 22500 Hz）。
plt.xlim(0, 1000) 只对应范围 1000x0.2 = 0-200 Hz。
这就是结果不可见的原因 - 它不在此范围内。

plt.xlim (0, 5000) 将纠正您的情况并将范围扩展到 0-1000 Hz。

jwalton 带来的解决方案 [:44100] 实际上只是强制 FFT 使用 N = 44100。这与 440_gen.wav 的计算重复了这种情况

解决您的问题更正确的方法是在代码中使用 N (Windows Size) 参数和 np.fft.fftfreq() 函数。

示例代码如下。

我还推荐一篇很棒的文章https://realpython.com/python-scipy-fft/

import numpy as np
import matplotlib.pyplot as plt
import scipy.io.wavfile as wave

N = 44100 # added

infile = "440_audacity.wav"
rate, data = wave.read(infile)

data = np.array(data)

data_fft = np.fft.fft(data, N)  # added N
frequencies = np.abs(data_fft)
x_freq = np.fft.fftfreq(N, 1/44100)  # added

plt.subplot(2,1,1)
plt.plot(data[:800])
plt.title("Original wave: " + infile)

plt.subplot(2,1,2)
plt.plot(x_freq, frequencies)  # added x_freq 
plt.title("Fourier transform results")

plt.xlim(0, 1000)
plt.tight_layout()
plt.show()

Answer 2

以下内容对我有用，并按预期制作了剧情：

import numpy as np
import matplotlib.pyplot as plt
import scipy.io.wavfile as wave

infile = "440_gen.wav"
rate, data = wave.read(infile)

data = np.array(data)

# Use first 44100 datapoints in transform
data_fft = np.fft.fft(data[:44100])
frequencies = np.abs(data_fft)

plt.subplot(2,1,1)
plt.plot(data[:800])
plt.title("Original wave: " + infile)

plt.subplot(2,1,2)
plt.plot(frequencies)
plt.title("Fourier transform results")

plt.xlim(0, 1000)

plt.tight_layout()

plt.show()

NumPy快速傅立叶变换（FFT）在Audacity中生成的正弦波上不起作用

2 个答案: