python - 对齐两个数据集的时间步长

时间:2015-10-25 18:21:41

标签: python dataset alignment

作为一个蟒蛇新手,我需要一些帮助。我有两个带温度数据值的文件。第一个文件包含时间步长为2秒的值。 (但有时甚至是秒,有时是不均匀的秒)。第二个文件包含时间步长为2.5分钟(180秒)的值。 如何对齐这两个数据集,以便我可以进行相关性分析?

非常感谢帮助。我现在不知道要发布什么代码,我想你们都明白我需要什么。如果没有,请告诉我。

提前致谢!

1 个答案:

答案 0 :(得分:0)

您可以使用spicy::interp1d为您进行插值。

一般的例子是

from scipy.interpolate import interp1d
x = np.linspace(0, 10, num=11, endpoint=True)
y = np.cos(-x**2/9.0)
f = interp1d(x, y)
xnew = np.arange(0, 9, 0.1)
ynew = f(xnew)   # use interpolation function returned by `interp1d`
plt.plot(x, y, 'o', xnew, ynew, 'x')
plt.show()

Plot showing original x,y and interpolated xnew,ynew

因此,在您的情况下,您的数据中包含xy,请定义新的xnew = np.arange(MIN, MAX, 1),其中您的步数为秒。确保将第二个文件的样本转换为秒,而不是几分钟。然后,您将xnew,ynew使用每个文件。