我正在寻找与pandas数据框等效的python set()函数。
前一段时间,我设置了如下的元组列表:
list(set([(11, 11), (21, 11), (11, 11)]))
现在我的数据看起来像
[(11, 11, timestamp()), (21, 11, timestamp()), (11, 11, timestamp())]
我决定创建数据框并运行
df.drop_duplicates(subset=['source', 'target'], keep='first')
但是df.drop_duplicates
的顺序必须与list(set())
中的顺序相同
有人知道我该怎么办?