我在pandas中有两个时间序列/数据帧,我需要从一个中获取索引,然后使用结转的最后一个值从另一个中提取匹配值。
示例:
从A帧和B帧开始,我想制作C,它与B具有相同的日期,但是有一个额外的列显示该日期之前A的最后观察值。
>>> A
Date Y
0 2010-01-01 6
1 2010-09-15 9
2 2011-05-01 12
>>> B
Date X
0 2009-02-01 1
1 2010-02-01 2
2 2010-03-01 3
3 2010-12-21 4
4 2011-08-01 5
>>> C
Date X Y
0 2009-02-01 1 NaN
1 2010-02-01 2 6
2 2010-03-01 3 6
3 2010-12-21 4 9
4 2011-08-01 5 12
答案 0 :(得分:3)
您可以使用.asof
功能。请注意,.asof
仅适用于pd.Series
作为索引的pd.DatetimeIndex
对象。
# must use Date as index
df_A = df_A.set_index('Date')
df_B = df_B.set_index('Date')
# asof
df_B['Y'] = df_A['Y'].asof(df_B.index)
X Y
Date
2009-02-01 1 NaN
2010-02-01 2 6
2010-03-01 3 6
2010-12-21 4 9
2011-08-01 5 12