熊猫:按日期分组和变换nunique返回太多条目

时间:2016-07-29 11:09:29

标签: python pandas group-by

我正在尝试在Pandas中进行一个简单的分组,并且它不能正常工作:

url='https://raw.githubusercontent.com/108michael/ms_thesis/master/raw_bills'

bills=pd.read_csv(url)
bills.date.nunique()
11 
bills.dtypes

date         float64
bills         object
id.thomas      int64
dtype: object 

bills[['date', 'bills']].groupby(['date']).bills.transform('nunique')

0       3627
1       7454
2       7454
3       7454
4       3627
5       7454
6       7454
7       3627
8       7454
9       7454
10      3627
11      7454
12      7454
13      7454
14      7454
15      7454
16      3627
17      3627
18      7454

之前我已经完成了这种分组,它通常可以正常工作。

对此有何建议?

1 个答案:

答案 0 :(得分:2)

我不确定你问的是什么,但是你不想使用:

bills[['date', 'bills']].groupby('date').bills.nunique()

date
2005.0    6820
2006.0    3738
2007.0    7454
2008.0    3627
2009.0    7324
2010.0    3297
2011.0    5787
2012.0    4647
2013.0    5694
2014.0    3211
2015.0       5
Name: bills, dtype: int64