我想将ID保存到列表中,这些列表的nunique()值计数大于某个阈值。
temp=df.groupby('id')['random_column'].nunique().sort_values(ascending=False)
上面的命令为所有id赋予其唯一的计数值,但是 count_values 没有任何column_name,因此当我尝试为例如设置条件时,会使用它们。 temp[temp.random_column>1]
,
我知道
AttributeError: 'Series' object has no attribute 'random_column'
。
但是,当我在整个命令中添加另一列时,我没有得到上面的错误:
temp=df.groupby('id')['random_column', 'one_more_column'].nunique()
temp[temp.random_column>1]
工作正常。
为什么我不能使用单个列来做同样的事情?