如何在条目设置时删除pandas中的重复项

时间:2017-11-23 18:45:23

标签: python-3.x pandas hash set series

我有一个系列,其条目是集合。我想使用pandas.Series.drop_duplicates()删除所有重复的条目,但会收到错误消息。这是一个例子:

import pandas as pd
ser = pd.Series([{1,2,3}, {4,5,6}, {4,5,6}])
ser.drop_duplicates()

最后一行给出以下异常:

  

TypeError:不可用类型:'设置'

我希望得到:

0    {1, 2, 3}
1    {4, 5, 6}

这是一个错误吗?还是有另一种方法来实现这个目标吗?

1 个答案:

答案 0 :(得分:1)

让我们使用astype(str)然后duplicated

ser[~ser.astype(str).duplicated(keep='first')]
Out[170]: 
0    {1, 2, 3}
1    {4, 5, 6}
dtype: object

更多信息:

ser.astype(str).duplicated(keep='first')
Out[171]: 
0    False
1    False
2     True
dtype: bool