我有一个系列,其条目是集合。我想使用pandas.Series.drop_duplicates()
删除所有重复的条目,但会收到错误消息。这是一个例子:
import pandas as pd
ser = pd.Series([{1,2,3}, {4,5,6}, {4,5,6}])
ser.drop_duplicates()
最后一行给出以下异常:
TypeError:不可用类型:'设置'
我希望得到:
0 {1, 2, 3}
1 {4, 5, 6}
这是一个错误吗?还是有另一种方法来实现这个目标吗?
答案 0 :(得分:1)
让我们使用astype(str)
然后duplicated
ser[~ser.astype(str).duplicated(keep='first')]
Out[170]:
0 {1, 2, 3}
1 {4, 5, 6}
dtype: object
更多信息:
ser.astype(str).duplicated(keep='first')
Out[171]:
0 False
1 False
2 True
dtype: bool