我正在尝试按小时对时间戳记数据进行分组,然后用零填充NaNs小时,然后为每小时创建一个箱线图。我尝试了下面的代码:
df.groupby(df.index.hour).fillna(0).boxplot()
并收到此错误:IndexError:列表索引超出范围
有关如何使用零代替NaN创建箱图的任何帮助吗?
样品df如下。 endDate是索引:
endDate sourceName sourceVersion device type unit creationDate startDate value
9/24/2014 15:07 iPhone StepCount count 10/2/2014 8:30 9/24/2014 15:07 47
9/24/2014 15:12 iPhone StepCount count 10/2/2014 8:30 9/24/2014 15:12 518
9/24/2014 15:17 iPhone StepCount count 10/2/2014 8:30 9/24/2014 15:17 608
9/24/2014 15:22 iPhone StepCount count 10/2/2014 8:30 9/24/2014 15:22 541
9/24/2014 15:27 iPhone StepCount count 10/2/2014 8:30 9/24/2014 15:27 823