我的问题与question
完全相同但是,我的语言是Python,而不是R.所以我再次提出这个问题。
我有两个时间序列,包含不同的时间戳和不同数量的数据点。
例如,
第一个数据是
第二个数据是
我将两个表连接成一个表。
我想做两件事。首先,时间指数应该是有序的。
pd.concat([df1, df2], axis=1)
很容易完成。结果是
第二件事是用最新的数据点替换'NA'。
例如,在时间0.1,列“B”的值是2.1,这是时间0.09处的值。以相同的方式,时间0.30处的列'A'的值应为3.0。但是,对于列'A',时间0.09没有值。
我该怎么做第二份工作?
谢谢!
答案 0 :(得分:0)
您可以将fillna
与方法ffill(向前填充)
>>> df.fillna(method='ffill')
A B
0.09 NaN 2.1
0.10 2.0 2.1
0.22 3.0 3.3
0.30 3.0 5.1
0.33 5.0 5.1
0.50 4.0 4.0
0.59 4.0 10.0
0.60 10.0 10.0
如果要将其重新分配到同一数据帧,请设置参数inplace = True