操作:先保存变量然后再操作vs单班轮

时间:2020-11-03 01:16:42

标签: python numeric operation stability

我正在用Python(使用numpy包)编写程序。我正在编写一个包含很长函数的程序,其中涉及许多术语:

result = a + b + c + d +...

...随便什么。这些术语a,b,c,d等...本身就是涉及许多操作的矩阵,例如在Python代码中:

a = np.identity(3, dtype = np.double)/3.0
b = np.kron(vec1, vec2).reshape(3,3) # Also with np.double precision.

仅考虑两个变量,我一直在想是否这样做:

a = np.identity(3, dtype = np.double)/3.0
b = np.kron(vec1, vec2).reshape(3,3) # Also with np.double precision.
c = a + b

与执行相同:

c = np.identity(3, dtype = np.double)/3.0 + np.kron(vec1, vec2).reshape(3,3)

这听起来很愚蠢,但是我需要非常高的数值稳定性,即引入数值误差,尽管如此微妙,但可能会破坏程序或产生怪异的结果。当然,这个问题可以扩展到其他编程语言。

建议哪个?有关系吗?有建议的参考吗?

1 个答案:

答案 0 :(得分:0)

在“正常”情况下,两种方法都是等效的。

换句话说,无论您通过显式表达式(例如np.identity(3, dtype = np.double)/3.0)还是通过已使用该表达式初始化的变量名(此处为a)使用值,结果“通常”是相同的。

在某些不太正常的情况下,它们可能会产生不同的结果。据我所知,所有这些都与产生副作用的情况有关,因此结果取决于事情发生的顺序。例如:

请考虑这样一种情况:变量名b的初始化涉及一个影响变量名a的初始化的副作用。假设您的代码取决于这种副作用。在这种情况下,采用第一手方法(首先初始化变量名,然后仅使用那些变量),您的代码将必须首先初始化b,然后再初始化a-变量名的初始化顺序很重要。在第二种方法中(要使用显式表达式而不是变量名,而要使用较大的表达式),要实现相同的效果,您将必须注意Python解释器对表达式中子表达式求值的顺序。 。如果您不这样做,那么子表达式的求值顺序可能不会产生您的代码所需的副作用,并且您最终可能会得到不同的结果。

对于其他编程语言,答案是很大的,这两种方法在使用不同语言(例如Java)的变量名具有关联的数据类型的语言中可能会产生不同的结果。会导致变量分配过程中发生一些无声的数值转换(例如截断)。