所以我有一个数据框
id value
a 1
b 1
a 1
c 1
d 2
a 1
g 2
....
如果id
等于value
,我想创建一个包含所有唯一1
的数组。在这种情况下,输出为['a', 'b', 'c']
。数据框已设置为不应重叠 - a
b
和c
仅在值等于1
时出现。
有什么建议吗?谢谢!
答案 0 :(得分:1)
使用loc
和布尔值掩码过滤数据框并选择“id”列,然后调用unique()
删除重复项:
In [5]:
df.loc[df.value == 1,'id'].unique()
Out[5]:
array(['a', 'b', 'c'], dtype=object)