Question

我有一个Pandas数据框，有四列＆lt; id1＆＃39;，＆＃39; id2＆＃39;，＆＃39; info1＆＃39;和＆＃39; info2＆＃39;。我希望不仅在经典意义上删除重复项，而且还要交换id1和id2。

示例：

＆＃39; Joe＆＃39;，＆＃39; Jane＆＃39;，1.2，＆＃39; Blue＆＃39;

和

＆＃39; Jane＆＃39;，＆＃39; Joe＆＃39;，1.2，＆＃39; Blue＆＃39;

必须视为重复。

id1和id2可以是任何类型，不仅是整数，浮点数或字符串。

Answer 1

对ids进行排序，然后调用drop_duplicates：

df[['id1', 'id2']] = np.sort(df[['id1', 'id2']], axis=1)
df.drop_duplicates(['id1', 'id2'])