的Python

Question

我正在使用Python（Numpy）和R进行数据分析。我的数据是向量795067 X 3并计算此数据的均值，中位数，标准差和IQR会产生不同的结果，具体取决于我是使用Numpy还是R我对这些值进行了交叉检查，看起来R给出的是＆＃34;正确的＆＃34;值。

Median: 
Numpy:14.948499999999999
R: 14.9632

Mean: 
Numpy: 13.097945407088607
R: 13.10936

Standard Deviation: 
Numpy: 7.3927612774052083
R: 7.390328

IQR: 
Numpy:12.358700000000002
R: 12.3468

两个平台上的数据的最大值和最小值相同。我进行了快速测试，以便更好地了解这里发生了什么。

在Numpy中乘以1.2 * 1.2给出1.4（与R相同）。
乘以1.22 * 1.22在Numpy中给出1.4884，在R.
但是，在Numpy中乘以1.222 * 1.222会给出1.4932839999999998，这显然是错误的！在R中进行乘法得到1.49324的正确答案。
在Numpy中乘以1.2222 * 1.2222得到1.4937728399999999和1.493773在R.再一次，R是正确的。

在Numpy中，数字是float64数据类型，它们在R中是双倍的。这里发生了什么？为什么Numpy和R会给出不同的结果？我知道R使用IEEE754双精度，但我不知道Numpy使用的精度。我如何改变Numpy给我＆＃34;正确＆＃34;回答？

Answer 1

的Python

Python中的print语句/函数将打印单精度浮点数。计算实际上将以指定的精度完成。 Python / numpy默认使用双精度浮点数（至少在我的64位机器上）：

import numpy

single = numpy.float32(1.222) * numpy.float32(1.222)
double = numpy.float64(1.222) * numpy.float64(1.222)
pyfloat = 1.222 * 1.222

print single, double, pyfloat
# 1.49328 1.493284 1.493284

print "%.16f, %.16f, %.16f"%(single, double, pyfloat)
# 1.4932839870452881, 1.4932839999999998, 1.4932839999999998

在交互式Python / iPython shell中，shell在打印语句结果时会打印双精度结果：

>>> 1.222 * 1.222
1.4932839999999998

In [1]: 1.222 * 1.222
Out[1]: 1.4932839999999998

- [R

在使用print和sprintf时，看起来R与Python的行为相同：

print(1.222 * 1.222)
# 1.493284

sprintf("%.16f", 1.222 * 1.222)
# "1.4932839999999998"

与交互式Python shell相比，交互式R shell在打印语句结果时也会打印单精度：

> 1.222 * 1.222
[1] 1.493284

Python和R之间的差异

在numpy中使用单精度值可能会导致结果的差异。具有大量加法/减法的计算最终会使问题浮出水面：

In [1]: import numpy

In [2]: a = numpy.float32(1.222)

In [3]: a*6
Out[3]: 7.3320000171661377

In [4]: a+a+a+a+a+a
Out[4]: 7.3320003

正如您对实际问题的评论中所建议的那样，请确保在numpy计算中使用双精度浮点数。

浮点数的乘法在Numpy和R中给出不同的结果

1 个答案:

的Python

- [R

Python和R之间的差异