Scipy频谱图与多个Numpy FFT的比较

时间:2018-08-17 15:44:40

标签: python numpy scipy fft spectrogram

我正在尝试优化某些给出的代码,其中FFT在时间序列(作为列表)上的滑动窗口中进行,并且每个结果都累积到一个列表中。原始代码如下:

def calc_old(raw_data):
    FFT_old = list()

    for i in range(0, len(raw_data), bf.WINDOW_STRIDE_LEN):
        if (i + bf.WINDOW_LEN) >= len(raw_data):
            # Skip the windows that would extend beyond the end of the data
            continue

        data_tmp = raw_data[i:i+bf.WINDOW_LEN]
        data_tmp -= np.mean(data_tmp)
        data_tmp = np.multiply(data_tmp, np.hanning(len(data_tmp)))
        fft_data_tmp = np.fft.fft(data_tmp, n=ZERO_PAD_LEN)
        fft_data_tmp = abs(fft_data_tmp[:int(len(fft_data_tmp)/2)])**2
        FFT_old.append(fft_data_tmp)

以及新代码:

def calc_new(raw_data):
    data = np.array(raw_data)  # Required as the data is being handed in as a list
    f, t, FFT_new = spectrogram(data,
                                fs=60.0,
                                window="hann",
                                nperseg=bf.WINDOW_LEN,
                                noverlap=bf.WINDOW_OVERLAP,
                                nfft=bf.ZERO_PAD_LEN,
                                scaling='spectrum')

总而言之,旧代码对时间序列进行窗口化,去除均值,应用Hann窗函数,进行FFT(零填充,如ZERO_PAD_LEN>WINDOW_LEN),然后取实数的绝对值。将其平方并平方以产生功率谱(V ** 2的单位)。然后,它将窗口移动WINDOW_STRIDE_LEN,并重复该过程,直到窗口扩展到数据末尾为止。这与WINDOW_OVERLAP重叠。

据我所知,频谱图应该对我给出的参数做同样的事情。但是,每个轴的FFT结果尺寸相差1(例如,旧代码为MxN,新代码为(M + 1)x(N + 1)),并且每个频点中的值都大不相同-几个数量级在某些情况下会很大。

我在这里想念什么?

2 个答案:

答案 0 :(得分:3)

缩放

calc_old中的实现无需任何缩放即可直接使用np.fft.fft的输出。

另一方面,实现calc_new使用scipy.signal.spectrogram,最终使用np.fft.rfft,但也根据接收到的scalingreturn_onesided参数缩放结果。更具体地说:

  • 对于默认的return_onesided=True(由于尚未在calc_new中提供明确的值),每个bin的值都会加倍以计算包括对称bin在内的总能量。
  • 对于提供的scaling='spectrum',值将进一步按因子1.0/win.sum()**2缩放。对于所选的Hann窗口,它对应于4/N**2,其中N=bf.WINDOW_LEN是窗口长度。

因此,您可能希望新的实现cald_new给您的结果是与8/bf.WINDOW_LEN**2相比,其总缩放比例为calc_old。另外,如果您希望第二个实现提供与calc_old相同的缩放比例,则应将scipy.signal.spectrogram的结果乘以0.125 * bf.WINDOW_LEN**2

频点数量

鉴于点nperseg的偶数,最初的实现calc_old仅保留nperseg//2个频点。

另一方面,完整的非冗余半频谱应为您提供nperseg//2 + 1频率频段(存在nperseg-2个具有相应对称性的频段,另加2个0Hz和奈奎斯特速率的非对称频段,因此请保持非冗余部分让您拥有(nperseg-2)//2 + 2 == nperseg//2 + 1)。这就是scipy.signal.spectrogram返回的结果。

换句话说,您的初始实现calc_old缺少了奈奎斯特频率槽。

时间步数

如果最后一个时间步计算剩余的样本少于calc_old,则bf.WINDOW_LEN中的实现将跳过最后一个时间步。仅当len(raw_data)-bf.WINDOW_STRIDE_LEN是的精确倍数时,它才会跳过这些样本 bf.WINDOW_LEN。我猜测您的特定输入序列并非如此。

相反,scipy.signal.spectrogram在需要时用额外的采样填充数据,以便在频谱图计算期间使用所有输入采样,与calc_old的实现相比,这可能导致一个额外的时间步长。

答案 1 :(得分:0)

可能有人知道原因,为什么在将频谱图结果与手动FFT进行比较时会出现一点差异?

# Parametrs of signal and its preprocessing
sample_rate = 4
window_size = 512 * sample_rate
detrend = 'linear'
tukey_alpha = 0.25
[![enter image description here][1]][1]
# Spectrogram
f, t, S = scipy.signal.spectrogram(signal, sample_rate, nperseg=window_size, noverlap=sample_rate, scaling='spectrum', mode='magnitude', detrend=detrend)

# FFT on the leftmost window of signal
windowed_signal = signal[:window_size]
windowed_signal = scipy.signal.detrend(windowed_signal, type=detrend)
windowed_signal *= scipy.signal.windows.tukey(window_size, tukey_alpha)
A = np.fft.rfft(windowed_signal)
freqs = np.fft.rfftfreq(window_size) * sample_rate
positive_freqs_n = int(np.ceil(window_size / 2.))
freqs_slice = slice(0, positive_freqs_n)
magnitudes = np.abs(A)[freqs_slice] / window_size

# Plotting
plt.plot(f, S.T[0], label='First window from scipy.signal.spectrogram')
plt.plot(freqs[freqs_slice], magnitudes, alpha=0.5, label='np.fft on first window')
plt.yscale('log')
plt.xscale('log')
plt.legend()
plt.xlabel('Frequency, Hz')
plt.ylabel('Magnitude')

enter image description here

这种小的纵向分歧可能来自何处? 谢谢!