pandas dataframe resample非时间序列列

时间:2017-04-26 12:28:56

标签: python pandas interpolation

我有两组数据(数据帧),每组有两列相互关联(让我们称之为x和y),如下所示:

设置1:

x   |   y
0.1 |   1
0.2 |   2
0.3 |   3
0.4 |   2
0.5 |   3
0.6 |   4
0.7 |   5

设置2:

x    |   y
0.12 |   0
0.21 |   2
0.31 |   5
0.44 |   4
0.52 |   3
0.61 |   1
0.76 |   1

我想对两个集合的y值求和(在相等的x点处),但是x略微未对齐。为了解决这个问题,我认为最好将这两个集合从x = 0.12到0.7以0.001步进行插值,基本上是:

mini = max(set1.x.min(), set2.x.min())
maxi = max(set1.x.max(), set2.x.max())
x_interpolation_points = np.arange(maxi, mini, 0.001)

# Next step: interpolate both sets
# last step: sumY = set1.y + set2.y

如何实现这一目标?如果是时间表我会使用resample()。interpolate(),但这不是一个时间表...

1 个答案:

答案 0 :(得分:1)

最后我用numpy解决了它:numpy.interp()