pandas dataframe的摘要数据

时间:2016-09-09 10:02:14

标签: python pandas

Describe()并不完全符合我的要求 - 所以我正在推销自己的版本。

除了最终指标&Num Unique Values'以下内容以下工作正常。这是返回数字,但他们不正确 - 我想我使用申请不正确?

pd.DataFrame({
        'Max':d.max(), 
        'Min':d.min(), 
        'Count':d.count(axis = 0),
        'Count Null':d.isnull().sum(),
        'Count Zero':d[d==0].count(),
        'Num Unique Values':d.apply(lambda x: x.nunique())
    }) 

1 个答案:

答案 0 :(得分:1)

对我来说它很好用:

print(df.apply(lambda x: x.nunique()))

样品:

df = pd.DataFrame({'A':[1,2,2,1],
                   'B':[4,5,6,4],
                   'C':[7,8,9,1],
                   'D':[1,3,5,9]})

print (df)
   A  B  C  D
0  1  4  7  1
1  2  5  8  3
2  2  6  9  5
3  1  4  1  9

print (df.apply(lambda x: x.nunique()))
A    2
B    3
C    4
D    4
dtype: int64

另一种解决方案:

print (df.apply(lambda x: len(x.unique())))
A    2
B    3
C    4
D    4
dtype: int64