非周期函数与NumPy的互相关

时间:2013-04-13 15:25:03

标签: python numpy signal-processing

我有两个数据集正在尝试交叉关联。它们看起来类似于arctan函数,所以我一直用它作为模型来计算如何进行信号处理。

x = linspace(-15, 15, 2**13)
f1 = arctan(x)
f2 = arctan(x + 2)

enter image description here

我需要回答的问题是,我需要移动绿色信号以使其(大部分)与蓝色信号重叠多少?我认为这就像在f1f2的互相关函数中找到最大值一样简单,我大致遵循了这里的建议:How to correlate two time series with gaps and different time bases?。这就是我一直在尝试的事情

c = correlate(f1, f2, 'full')
s = arange(1-2**13, 2**13)
dx = 30/2**13
shift = s[c.argmax()]*dx

我希望shift或多或少恰好等于2,但事实上它只是0.234。这对我没有任何意义;我找到了互相关最大值的x坐标,应该在两个信号最大重叠的地方找到。

有关如何计算此类功能的数量的任何想法?

编辑:我应该补充一点,对于我的真实数据,所有值都在0到1之间

编辑编辑:以下功能实际上更像我的真实数据:

x = linspace(-15, 15, 400)
f1 = (arctan(-x) + pi/2) / pi
f2 = (arctan(-x + 2) + pi/2) / pi

enter image description here

所以使用这里给出的公式:http://paulbourke.net/miscellaneous/correlate/我可以编写一个互相关函数来填充数据,在左边添加一个,在右边添加零:

def xcorr(x, y);
    mx = x.mean()
    my = y.mean()
    sx = x.std()
    sy = y.std()
    r = zeros(2*len(x))

    for d in range(-len(x), len(x)):
        csum = 0
        for i in range(0, len(x):
            yindx = i - d
            if i - d < 0:
                yval = 1
            elif i - d >= len(x):
                yval = 0
            else:
                yval = y[yindx]
            csum += (x[i] - mx) * (yval - my)
        r[d + len(x)] = csum / (sx * sy)
    return r

使用此功能,我现在可以

c = xcorr(f1, f2)
s = arange(-400, 400)
dx = 30/400
shift = s[c.argmax()] * dx

出现在2.025,这个精度与你可以达到2的距离很近。所以看起来Jamie是正确的,问题在于numpy correlate如何填充信号。

所以,显然我的xcorr函数实际上很慢。现在的问题是,有没有办法让NumPy做类似的事情,或者我应该继续使用ctypes在C中编写我的算法?

2 个答案:

答案 0 :(得分:3)

正如人们所指出的那样,互相关因数据之外的填充而混淆。

虽然感觉好像丢弃了良好的数据,但通常最好只修剪数据集,以便无需假设即可完成相关性(至少与将实际数据与补偿数据相关联的替代方法相比较填充)。

x = linspace(-15, 15, 4000)
f1 = (arctan(-x) + pi/2) / pi
f2 = (arctan(-x + 2) + pi/2) / pi

L4 = int(len(f2)/8)
sf2 = f2[L4:-L4]

c = correlate(f1-mean(f1), sf2-mean(f1), 'same')
print "peak correlation occurs at:", x[argmax(c)]  # -2.02925731433

plt.plot(x, c)
plt.show()

enter image description here

另外,我不确定xcorr是最好的方法。如何只是将不同班次的y轴值之间的距离相加并取最小值,这样就可以摆脱零点所在的所有问题,等等。

答案 1 :(得分:1)

互相关的最大值是两个信号的乘积之和最大的偏移。可以认为两个信号的互相关,一个是另一个的时移,在移位时最大。虽然对于无限信号也是如此,numpy会对两个信号进行零填充,因此对于两个相同长度的信号,对于零移位,您只有2**13非零值的总和,并且来自两个函数的更好匹配是偏移的,但是非零值更少。

如果您的信号在+/-无穷大时为0,那就太糟糕了。事实上,我无法使用互相关来提出任何合理的解决方案。