我有一个数据框,其中一些SongId被重复。我想提取那些有重复的行。知道怎么样?尝试:
dfB[dfB.SongId.duplicated()]
但效果不佳。
这是我的数据框的一个例子。在此示例中重复了SongId 0,10和16:
答案 0 :(得分:1)
试试这个,
df=pd.DataFrame({"Song ID":[0,0,1,3,1,4,5],'ArtistID':[12,13,34,1,21,43,22]})
print df[df.duplicated(subset=['Song ID'],keep=False)]
输出:
Song ID value
0 0 12
1 0 13
2 1 34
4 1 21