Question

我有一个数据框，其中一些SongId被重复。我想提取那些有重复的行。知道怎么样？尝试：

dfB[dfB.SongId.duplicated()]

但效果不佳。

这是我的数据框的一个例子。在此示例中重复了SongId 0,10和16：

Answer 1

试试这个，

df=pd.DataFrame({"Song ID":[0,0,1,3,1,4,5],'ArtistID':[12,13,34,1,21,43,22]})
print df[df.duplicated(subset=['Song ID'],keep=False)]

输出：

   Song ID  value
0        0     12
1        0     13
2        1     34
4        1     21