我有一个像这样的DataFrame:
item_id item_price
1 10.0
1 5.0
1 6.0
1 7.0
2 2.0
3 3.0
4 5.0
然后,我尝试获取一个item_price
列仅包含一系列唯一值的DataFrame。像这样删除其他不符合此条件的行:
item_id item_price
2 2.0
3 3.0
4 5.0
但是,我对如何在Pandas中实现它感到困惑。任何帮助将不胜感激。
答案 0 :(得分:0)
使用带有参数subset
的{{3}}来标识用于检查重复项的列,并使用keep=False
来删除所有重复行:
df = df.drop_duplicates(subset=['item_id'], keep=False)
print (df)
item_id item_price
4 2 2.0
5 3 3.0
6 4 5.0