numpy.tolist()和list()之间的精度/显示差异

时间:2017-08-15 08:04:13

标签: python numpy floating-accuracy

这是coldspeed's question的后续行动。

(这不是is floating point math broken ? BTW的重复)

我将列表列表转换为numpy数组,然后尝试将其转换回python列表列表。

import numpy as np

x = [[  1.00000000e+00,   6.61560000e-13],
       [  2.00000000e+00,   3.05350000e-13],
       [  3.00000000e+00,   6.22240000e-13],
       [  4.00000000e+00,   3.08850000e-13],
       [  5.00000000e+00,   1.11170000e-10],
       [  6.00000000e+00,   3.82440000e-11],
       [  7.00000000e+00,   5.39160000e-11],
       [  8.00000000e+00,   1.75910000e-11],
       [  9.00000000e+00,   2.27330000e-10]]

x=np.array(x,np.float)
print([y.tolist() for y in x])
print([list(y) for y in x])

结果:

[[1.0, 6.6156e-13], [2.0, 3.0535e-13], [3.0, 6.2224e-13], [4.0, 3.0885e-13], [5.0, 1.1117e-10], [6.0, 3.8244e-11], [7.0, 5.3916e-11], [8.0, 1.7591e-11], [9.0, 2.2733e-10]]
[[1.0, 6.6155999999999996e-13], [2.0, 3.0535000000000001e-13], [3.0, 6.2223999999999998e-13], [4.0, 3.0884999999999999e-13], [5.0, 1.1117e-10], [6.0, 3.8243999999999997e-11], [7.0, 5.3915999999999998e-11], [8.0, 1.7591e-11], [9.0, 2.2733e-10]]

请注意,尝试匹配python本机类​​型也会失败(相同的行为):

x=np.array(x,dtype=float)

因此,使用numpy.tolist将列表转换回普通python列表会保留值,而通过调用list强制迭代会引入舍入错误。

有趣的事实:

  • str([y.tolist() for y in x])==str([list(y) for y in x])会产生False(正如所料,不同的打印输出)
  • [y.tolist() for y in x]==[list(y) for y in x]收益True(怎么回事?)

有什么想法? (使用python 3.4 64位窗口)

1 个答案:

答案 0 :(得分:3)

这样做的原因是,即使保持相同的值,这两种方法也会产生具有不同字符串表示的不同类型。调用np.tolist会将数组元素转换为float数据类型,而调用list时不会更改导致numpy.float64 s的数据类型:

import numpy as np

x = [[  1.00000000e+00,   6.61560000e-13],
       [  2.00000000e+00,   3.05350000e-13],
       [  3.00000000e+00,   6.22240000e-13],
       [  4.00000000e+00,   3.08850000e-13],
       [  5.00000000e+00,   1.11170000e-10],
       [  6.00000000e+00,   3.82440000e-11],
       [  7.00000000e+00,   5.39160000e-11],
       [  8.00000000e+00,   1.75910000e-11],
       [  9.00000000e+00,   2.27330000e-10]]

x=np.array(x,np.float)

print(type(x[0].tolist()[0]))     # `float`
print(type(list(x[0])[0]))        # `numpy.float64`

由于那些具有不同的字符串表示(float四舍五入,而numpy.float64打印完整精度),会打印不同的结果并且str([y.tolist() for y in x])==str([list(y) for y in x])的比较失败,而值明智比较通行证。