将函数应用于pandas中数据框的每一列

时间:2017-03-30 05:06:48

标签: python pandas dataframe data-science

我有这个:

df = DataFrame(dict(person= ['andy', 'rubin', 'ciara', 'jack'], 
     item = ['a', 'b', 'a', 'c'], 
     group= ['c1', 'c2', 'c3', 'c1'], 
     age= [23, 24, 19, 49]))
df:

    age group item person
0   23  c1    a    andy
1   24  c2    b    rubin
2   19  c3    a    ciara
3   49  c1    c    jack

我想要做的是获取每列中唯一项目的长度。 现在我知道我可以做类似的事情:

len(df.person.unique())

每列。

有没有办法一次性完成所有列?

我试着这样做:

for column in df.columns:
    print(len(df.column.unique()))

但我知道这不对。

我该如何做到这一点?

4 个答案:

答案 0 :(得分:3)

你想要pd.Series.nunique

df.apply(pd.Series.nunique)

age       4
group     3
item      3
person    4
dtype: int64

答案 1 :(得分:2)

您可以使用:

for column in df:
    print(len(df[column].unique()))

4
3
3
4      

或者:

for column in df:
    print(df[column].nunique())

4
3
3
4

答案 2 :(得分:2)

您可以将每列中的唯一项目数量设为:

for column in df.columns:
    print(len(df[column].unique()))

答案 3 :(得分:1)

为什么不是这样,

5/10/2018