我有一个包含重复条目的pandas数据框,我想使用tsplot
创建seaborn
。我在数据框上调用drop_duplicates
(甚至调用reset_index()
)但是当我完成情节时我仍然会得到
ValueError: Index contains duplicate entries, cannot reshape
drop_duplicates
无法解决此问题的原因是什么?
编辑我甚至在删除后通过调用数据框上的duplicated
进行检查,所有行都显示False
。正如我所料。
我意识到这里没什么可走的,我只是想知道是否有一些我缺失的直觉。将尝试创建一个小例子来显示,但我的数据集相当大
答案 0 :(得分:1)
drop_duplicates
不适用于索引,但适用于数据框中的值! (因此它查找重复的行,而不是重复的索引)。
但是你在索引上也有相同的功能(见doc):
df.index.drop_duplicates()
使用生成的索引,您可以重新索引。
另一种选择是将索引添加为列,并在该列上使用DataFrame.drop_duplicates
另一种选择是使用groupby:df.groupby(level=0).first()
(并使first
适应您想要对重复行执行的操作)