是否有一个函数强制索引是唯一的,或者它只能通过转换为dict和back或类似的东西来在python'本身'中处理它?</ p>
如下面的评论中所述:python pandas是一个基于numpy / scipy构建的项目。
to_dict和返回工作,但我敢打赌,当你获得大奖时,这会变慢。
In [24]: a = pandas.Series([1,2,3], index=[1,1,2])
In [25]: a
Out[25]:
1 1
1 2
2 3
In [26]: a = a.to_dict()
In [27]: a
Out[27]: {1: 2, 2: 3}
In [28]: a = pandas.Series(a)
In [29]: a
Out[29]:
1 2
2 3
答案 0 :(得分:6)
顺便说一句,我们计划在不久的将来向drop_duplicates
系列添加DataFrame.drop_duplicates
方法。
答案 1 :(得分:3)
使用groupby
和last()
In [279]: s
Out[279]:
a 1
b 2
b 3
b 4
e 5
In [280]: grouped = s.groupby(level=0)
In [281]: grouped.first()
Out[281]:
a 1
b 2
e 5
In [282]: grouped.last()
Out[282]:
a 1
b 4
e 5