Pandas groupby没有multiindex的列

时间:2014-03-31 14:03:23

标签: python pandas

我有一个数据框,其中包含一个月内火车站的数据,其中三个是索引:站点,日期,小时。 我看起来像这样:

Station    Date       Hour    Passengers 
Berlin HBF 2012-12-24 12:00   1000 
Berlin HBF 2012-12-24 13:00   2000  
Berlin HBF 2012-12-24 14:00   1000  
Berlin HBF 2012-12-24 15:00   1000  
....
Stuttgart 2012-12-24 12:00    500  

由于我只对一个月的电台总和感兴趣,我想按电台,日期和小时分组,以便最终结果如下:

Station    Passengers 
Berlin HBF 4000 
....
Stuttgart  500  

但我无法让这个解决方案的熊猫,我试过: byStation = traindata.groupby(['Station','Date','Hour'])。agg(np.sum()) 但这只是返回一个多索引,包含所有行...

1 个答案:

答案 0 :(得分:2)

看起来你想要按照" Station"只对和#34; Passangers" -column做一笔总结。这里不需要多索引。您的解决方案将创建一个,但由于它与原始数据相同,因此它无用。

这个应该有效:

traindata.groupby("Station").Passengers.sum()