大熊猫数据帧计算的不稳定性

时间:2015-11-10 19:52:26

标签: python numpy pandas

我想知道是否有人曾经看过Pandas的这个问题。基本上,我试图逐个元素地添加,乘法和除法DataFrames(所有帧都有相同的索引和列),但是Pandas正在为连续执行的相同计算吐出不同的结果。

下面显示了一些示例输出的图像。我在下面的代码中使用了.values,因为出于显示目的,但在使用.add().mul().div()时可能会发生不稳定。例如,如果我反复输入N11.add(N00),我通常会得到正确答案,但偶尔(每4或5次),我会得到一个填充0的数据框。

enter image description here

如果重要的话,我在Windows 10上使用Anaconda分发的Pandas 0.17.0(在Spyder 2.3.7上使用Python 2.7.10)。我正在使用的帧很大(6856乘12511)。还有其他人遇到过这个问题吗?这是一个已知问题还是我做错了什么?

1 个答案:

答案 0 :(得分:2)

我今天遇到了类似的问题,它是由a bug in numexpr 2.4.4引起的。它似乎以各种方式咬住其他大熊猫用户,如this pandas ticket及其他与之相关的报道。

将numexpr升级到2.4.6解决了我们的问题,但看起来任何不是2.4.4的版本应该没问题!