使用scipy.signal.welch无法找到合适的能量

时间:2015-04-03 09:41:15

标签: python numpy signal-processing fft discrete-mathematics

对于间距为x(t)的给定离散时间信号dt(等于1/fsfs为采样率),能量为:

E[x(t)] = sum(abs(x)**2.0)/fs

然后我执行x(t)的DFT:

x_tf = np.fft.fftshift( np.fft.fft( x ) ) / ( fs * ( 2.0 * np.pi ) ** 0.5 )

再次计算能量:

E[x_tf] = sum( abs( x_tf ) ** 2.0 ) * fs * 2 * np.pi / N

(此处因子fs*2*np.pi/N =脉动间距dkfftfreq的文档提供了有关频域间距的更多详细信息),我有相同的能量:

E[x(t)] = E[x_tf]

但是......当我用x(t)计算scipy.signal.welch的功率谱密度时,我找不到合适的能量。 scipy.signal.welch会返回频率f和能量Pxx的矢量(或每个频率的能量,具体取决于我们在scaling的参数中输入的scipy.signal.welch

如何使用E[x(t)]找到与E[x_tf]Pxx相同的能量?我试着计算:

E_psd = sum(Pxx_den) / nperseg

其中nperseg是Welch算法的每个段的长度,fsnp.sqrt(2*np.pi)等因素被抵消,并使用{{1}重新缩放E [x(t)] },但没有任何成功(数量级小于nperseg

我使用以下代码生成我的信号:

E[x(t)]

我做了以下工作来获得功率谱密度:

#Generate a test signal, a 2 Vrms sine wave at 1234 Hz, corrupted by 0.001 V**2/Hz of white noise sampled at 10 kHz.

fs = 10e3   #sampling rate, dt = 1/fs
N = 1e5
amp = 2*np.sqrt(2)
freq = 1234.0
noise_power = 0.001 * fs / 2
time = np.arange(N) / fs
x = amp*np.sin(2*np.pi*freq*time)
x += np.random.normal(scale=np.sqrt(noise_power), size=time.shape)

1 个答案:

答案 0 :(得分:20)

对这种明显差异的解决方法在于仔细理解和应用

  • 连续与离散傅立叶变换,
  • 给定信号的能量,功率和功率谱密度

我也一直在努力解决这个问题,所以我会尽量在下面的讨论中尽可能明确。

离散傅立叶变换(DFT)

满足某些可积性条件的连续信号x(t)具有傅里叶变换X(f)。然而,当使用离散信号x [n]时,通常使用离散时间傅里叶变换(DTFT)。我将DTFT表示为X_ {dt}(f),其中dt等于相邻样本之间的时间间隔。回答问题的关键要求您认识到DTFT 等于相应的傅里叶变换!事实上,这两者是相关的

X_ {dt}(f)=(1 / dt)* X(f)

此外,离散傅立叶变换(DFT)仅仅是DTFT的离散样本。当然,DFT是使用np.fft.fft(...)时Python返回的内容。因此,您的计算DFT 等于傅立叶变换!

功率谱密度

scipy.signal.welch(..., scaling='density', ...)返回离散信号x [n]的power spectral density (PSD)的估计值。关于PSD的全面讨论有点超出了本文的范围,但对于简单的周期性信号(例如在您的示例中),PSD S_ {xx}(f)给出为

S_ {xx} = | X(f)| ^ 2 / T

其中| X(f)|是信号的傅立叶变换,T是信号的总持续时间(时间)(如果你的信号x(t)是一个随机过程,我们必须在系统的许多实现中采用整体平均值。 ..)。信号中的总功率只是S_ {xx}在系统频率带宽上的积分。使用上面的代码,我们可以写

import scipy.signal

# Estimate PSD `S_xx_welch` at discrete frequencies `f_welch`
f_welch, S_xx_welch = scipy.signal.welch(x, fs=fs)

# Integrate PSD over spectral bandwidth
# to obtain signal power `P_welch`
df_welch = f_welch[1] - f_welch[0]
P_welch = np.sum(S_xx_welch) * df_welch

要联系您的np.fft.fft(...)计算(返回DFT),我们必须使用上一节中的信息,即

X [k] = X_ {dt}(f_k)=(1 / dt)* X(f_k)

因此,要计算FFT计算的功率谱密度(或总功率),我们需要认识到

S_ {xx} = | X [k] | ^ 2 *(dt ^ 2)/ T

# Compute DFT
Xk = np.fft.fft(x)

# Compute corresponding frequencies
dt = time[1] - time[0]
f_fft = np.fft.fftfreq(len(x), d=dt)

# Estimate PSD `S_xx_fft` at discrete frequencies `f_fft`
T = time[-1] - time[0]
S_xx_fft = ((np.abs(Xk) * dt) ** 2) / T

# Integrate PSD over spectral bandwidth to obtain signal power `P_fft`
df_fft = f_fft[1] - f_fft[0]
P_fft = np.sum(S_xx_fft) * df_fft

P_welchP_fft的值应该非常接近,并且接近信号中的预期功率,可以计算为< / p>

# Power in sinusoidal signal is simply squared RMS, and
# the RMS of a sinusoid is the amplitude divided by sqrt(2).
# Thus, the sinusoidal contribution to expected power is
P_exp = (amp / np.sqrt(2)) ** 2 

# For white noise, as is considered in this example,
# the noise is simply the noise PSD (a constant)
# times the system bandwidth. This was already
# computed in the problem statement and is given
# as `noise_power`. Simply add to `P_exp` to get
# total expected signal power.
P_exp += noise_power

注意: P_welchP_fft不会完全相等,甚至可能在数值准确度范围内不相等。这可归因于存在与功率谱密度的估计相关联的随机误差的事实。为了减少这些错误,Welch的方法将您的信号分成几个段(其大小由nperseg关键字控制),计算每个段的PSD,并平均PSD以获得更好的估计信号的PSD(平均的段数越多,产生的随机误差越小)。实际上,FFT方法仅相当于对一个大段进行计算和平均。因此,我们预计P_welchP_fft之间会有一些差异,但我们应该期望P_welch更准确。

信号能量

正如您所说,信号能量可以从Parseval定理的离散形式获得

# Energy obtained via "integrating" over time
E = np.sum(x ** 2)

# Energy obtained via "integrating" DFT components over frequency.
# The fact that `E` = `E_fft` is the statement of 
# the discrete version of Parseval's theorem.
N = len(x)
E_fft = np.sum(np.abs(Xk) ** 2) / N

我们现在想了解上面通过S_xx_welch计算的scipy.signal.welch(...)与信号中的总能量E的关系。从上面S_xx_fft = ((np.abs(Xk) * dt) ** 2) / T。重新排列此表达式中的术语,我们看到np.abs(Xk) ** 2 = (T / (dt ** 2)) * S_xx_fft。此外,

从上面,我们知道np.sum(S_xx_fft) = P_fft / df_fft以及P_fftP_welch大致相等。此外,P_welch = np.sum(S_xx_welch) / df_welch以便我们获得

np.sum(S_xx_fft) = (df_welch / df_fft) * np.sum(S_xx_welch)

此外,S_xx_fft = ((np.abs(Xk) * dt) ** 2) / T。将S_xx_fft替换为上述等式并重新排列术语,我们到达

np.sum(np.abs(Xk) ** 2) = (T / (dt ** 2)) * (df_welch / df_fft) * np.sum(S_xx_welch)

上述等式中的左侧(LHS)现在应该看起来非常接近于从DFT分量计算的信号中总能量的表达式。现在,请注意T / dt = N,其中N是信号中的采样点数。除以N,我们现在有一个LHS,根据定义,它等于上面计算的E_fft。因此,我们可以通过

获得来自Welch PSD的信号中的总能量
# Signal energy from Welch's PSD
E_welch = (1. / dt) * (df_welch / df_fft) * np.sum(S_xx_welch)

EE_fftE_welch都应该非常接近值:)正如前一节末尾所讨论的那样,我们预计{{1}之间会有一些细微差别与E_welchE进行比较,但这可归因于从Welch方法派生的值减少了随机误差(即更准确)。