在groupby之后如何使用单个列的唯一值计数来应用某些条件?

时间:2019-06-09 14:27:51

标签: python pandas dataframe series

我想将ID保存到列表中,这些列表的nunique()值计数大于某个阈值。

temp=df.groupby('id')['random_column'].nunique().sort_values(ascending=False)

上面的命令为所有id赋予其唯一的计数值,但是 count_values 没有任何column_name,因此当我尝试为例如设置条件时,会使用它们。 temp[temp.random_column>1]

我知道

AttributeError: 'Series' object has no attribute 'random_column'

但是,当我在整个命令中添加另一列时,我没有得到上面的错误: temp=df.groupby('id')['random_column', 'one_more_column'].nunique()

temp[temp.random_column>1]工作正常。

为什么我不能使用单个列来做同样的事情?

0 个答案:

没有答案