熊猫:按时间处理数据帧索引中的缺失数据

时间:2015-05-07 15:05:00

标签: python pandas date-range

我得到了以下DataFrame(示例):

Error in as.expression("Weight " * bgroup("(", frac(lbs, 1000), ")")) :  could not find function "bgroup"

您可以看到 date Value1 Value2 2007-05-25 11:50:00 1 15 2007-05-25 12:00:00 2 30 2007-05-25 12:10:00 3 25 2007-05-25 12:50:00 2 34 2007-05-25 13:00:00 9 35 2007-05-25 13:10:00 6 10 2007-05-25 12:20:00之前的数据丢失。我想做的是像这样的数据框:

2007-05-25 12:40:00

一般来说,我想知道哪些时候我没有数据。我在想这样的事情:

               date  Value1 Value2
2007-05-25 11:50:00   1       15 
2007-05-25 12:00:00   2       30
2007-05-25 12:10:00   3       25
2007-05-25 12:20:00   NaN     NaN
2007-05-25 12:30:00   NaN     NaN
2007-05-25 12:40:00   NaN     NaN
2007-05-25 12:50:00   2       34
2007-05-25 13:00:00   9       35
2007-05-25 13:10:00   6       10

但是,至于我通过测试DataRange = pd.date_range(data.index[0],data.index[-1]) data = data.reindex(DataRange, fill_value=nan) 而无法应对,因为函数的名称是日期范围。所以我想知道是否有类似的会议记录(在我的情况下是10分钟)或是否有另一种方式来实现它。

1 个答案:

答案 0 :(得分:1)

致电resample并将规则作为'10Min'传递:

In [309]:

df.resample('10Min')
Out[309]:
                     Value1  Value2
date                               
2007-05-25 11:50:00       1      15
2007-05-25 12:00:00       2      30
2007-05-25 12:10:00       3      25
2007-05-25 12:20:00     NaN     NaN
2007-05-25 12:30:00     NaN     NaN
2007-05-25 12:40:00     NaN     NaN
2007-05-25 12:50:00       2      34
2007-05-25 13:00:00       9      35
2007-05-25 13:10:00       6      10

可以找到一些示例here