python pandas删除系列中的重复项

时间:2012-10-18 19:56:34

标签: python pandas

是否有一个函数强制索引是唯一的,或者它只能通过转换为dict和back或类似的东西来在python'本身'中处理它?<​​/ p>

如下面的评论中所述:python pandas是一个基于numpy / scipy构建的项目。

to_dict和返回工作,但我敢打赌,当你获得大奖时,这会变慢。

In [24]: a = pandas.Series([1,2,3], index=[1,1,2])

In [25]: a
Out[25]: 
1    1
1    2
2    3

In [26]: a = a.to_dict()

In [27]: a
Out[27]: {1: 2, 2: 3}

In [28]: a = pandas.Series(a)

In [29]: a
Out[29]: 
1    2
2    3

2 个答案:

答案 0 :(得分:6)

顺便说一句,我们计划在不久的将来向drop_duplicates系列添加DataFrame.drop_duplicates方法。

答案 1 :(得分:3)

使用groupbylast()

In [279]: s
Out[279]: 
a    1
b    2
b    3
b    4
e    5

In [280]: grouped = s.groupby(level=0)

In [281]: grouped.first()
Out[281]: 
a    1
b    2
e    5

In [282]: grouped.last()
Out[282]: 
a    1
b    4
e    5