Question

我正在用Python（使用numpy包）编写程序。我正在编写一个包含很长函数的程序，其中涉及许多术语：

result = a + b + c + d +...

...随便什么。这些术语a，b，c，d等...本身就是涉及许多操作的矩阵，例如在Python代码中：

a = np.identity(3, dtype = np.double)/3.0
b = np.kron(vec1, vec2).reshape(3,3) # Also with np.double precision.

仅考虑两个变量，我一直在想是否这样做：

a = np.identity(3, dtype = np.double)/3.0
b = np.kron(vec1, vec2).reshape(3,3) # Also with np.double precision.
c = a + b

与执行相同：

c = np.identity(3, dtype = np.double)/3.0 + np.kron(vec1, vec2).reshape(3,3)

这听起来很愚蠢，但是我需要非常高的数值稳定性，即引入数值误差，尽管如此微妙，但可能会破坏程序或产生怪异的结果。当然，这个问题可以扩展到其他编程语言。

建议哪个？有关系吗？有建议的参考吗？

Answer 1

在“正常”情况下，两种方法都是等效的。

换句话说，无论您通过显式表达式（例如np.identity(3, dtype = np.double)/3.0）还是通过已使用该表达式初始化的变量名（此处为a）使用值，结果“通常”是相同的。

在某些不太正常的情况下，它们可能会产生不同的结果。据我所知，所有这些都与产生副作用的情况有关，因此结果取决于事情发生的顺序。例如：

请考虑这样一种情况：变量名b的初始化涉及一个影响变量名a的初始化的副作用。假设您的代码取决于这种副作用。在这种情况下，采用第一手方法（首先初始化变量名，然后仅使用那些变量），您的代码将必须首先初始化b，然后再初始化a-变量名的初始化顺序很重要。在第二种方法中（要使用显式表达式而不是变量名，而要使用较大的表达式），要实现相同的效果，您将必须注意Python解释器对表达式中子表达式求值的顺序。。如果您不这样做，那么子表达式的求值顺序可能不会产生您的代码所需的副作用，并且您最终可能会得到不同的结果。

对于其他编程语言，答案是很大的是，这两种方法在使用不同语言（例如Java）的变量名具有关联的数据类型的语言中可能会产生不同的结果。会导致变量分配过程中发生一些无声的数值转换（例如截断）。

操作：先保存变量然后再操作vs单班轮

1 个答案: