Question

我遇到了df.duplicated（）错误地返回true的问题。当我重置索引（df.reset_index（））时，df.duplicates（）返回正确的结果。

这个问题是raised in 2013但是，原因尚未确定，只是解决了问题。从SQL数据库读取数据后，我现在遇到了问题。如果有人有解决方案，我将非常感激，因为我不想每次运行.duplicated（）方法时都不得不求助于重置df的索引。

当我显示＆＃39;复制品时，我会得到以下信息。使用df [df.duplicated（）]：

name        type  code 
John Doe    A     6532  
Jane Doe    A     1124 
Rudolph Doe B     3412

这些都不是重复的。在我执行df.reset_index（）后，我得到完全不同（和正确）的结果。

我很困惑，并在互联网上寻找解决方案。我感谢任何人提供的帮助。

我正在使用最新的Pandas（0.19.1）版本。但是，我尝试使用0.18并遇到了同样的问题。

Answer 1

我的RAM中有一根今天死了。一旦被替换，这个问题就不再成为问题。我假设这是造成我问题的原因，因为我在更换RAM后没有任何问题。

感谢您的评论和尝试提供帮助。我真的很感激。