在调用drop_duplicates之后,索引包含重复的条目

时间:2014-12-04 22:32:35

标签: python pandas duplicates dataframe seaborn

我有一个包含重复条目的pandas数据框,我想使用tsplot创建seaborn。我在数据框上调用drop_duplicates(甚至调用reset_index())但是当我完成情节时我仍然会得到

ValueError: Index contains duplicate entries, cannot reshape

drop_duplicates无法解决此问题的原因是什么?

编辑我甚至在删除后通过调用数据框上的duplicated进行检查,所有行都显示False。正如我所料。

我意识到这里没什么可走的,我只是想知道是否有一些我缺失的直觉。将尝试创建一个小例子来显示,但我的数据集相当大

1 个答案:

答案 0 :(得分:1)

drop_duplicates不适用于索引,但适用于数据框中的值! (因此它查找重复的行,而不是重复的索引)。

但是你在索引上也有相同的功能(见doc):

df.index.drop_duplicates()

使用生成的索引,您可以重新索引。
另一种选择是将索引添加为列,并在该列上使用DataFrame.drop_duplicates 另一种选择是使用groupby:df.groupby(level=0).first()(并使first适应您想要对重复行执行的操作)