适合3D中的一组点的平面:scipy.optimize.minimize vs scipy.linalg.lstsq

时间:2016-01-28 19:22:05

标签: python scipy mathematical-optimization

给定3D中的一组点,一般问题是以下列形式找到平面方程的a, b, c系数:

z = a*x + b*y + c

这样得到的平面是最适合可能的那组点。

  1. this SO answer中,函数scipy.optimize.minimize用于解决此问题。

    它依赖于系数的初始猜测,并最小化误差函数,该函数将每个点与平面表面的距离相加。

  2. this code(基于this other SO answer)中,scipy.linalg.lstsq函数用于解决同一问题(限于一阶多项式时)。

    它在等式C中求解z = A*C,其中A是点集x,y坐标的串联,z是集合的z坐标,Ca,b,c系数。

    与上述方法中的代码不同,这个代码似乎不需要对平面系数进行初始猜测。

  3. 由于minimize函数需要初始猜测,这意味着它可能会或可能不会收敛到最优解(取决于猜测的好坏程度)。第二种方法是否有类似的警告,或者它会返回一个始终精确的解决方案吗?

2 个答案:

答案 0 :(得分:8)

保证最小二乘(scipy.linalg.lstsq)收敛。实际上,有一个封闭形式的解析解(由(A^T A)^-1 A^Tb给出(其中^T是矩阵转置,^-1是矩阵求逆)

然而,标准优化问题通常无法解决 - 我们无法保证找到最小化值。但是,对于给定的等式,找到一些a, b, c使得z = a*x + b*y + c,我们有一个线性优化问题(约束和目标在我们试图优化的变量中是线性的)。线性优化问题通常是可解决的,因此scipy.optimize.minimize应收敛到最佳值。

注意:即使我们z = a*x + b*y + d*x^2 + e*y^2 + f,我们的约束也是线性的 - 我们不必将自己限制在(x,y)的线性空间,因为我们将得到这些点{{1 }} 已经。对于我们的算法,这些看起来就像矩阵(x, y, x^2, y^2)中的点。所以我们实际上可以使用最小二乘法获得更高阶的多项式!

暂时搁置:实际上,所有不使用精确分析解决方案的解算器通常会在实际答案的某个可接受范围内停止,因此我们很少得到这种情况。 完全解决方案,但它往往非常接近我们在实践中接受它。此外,即使最小二乘解算器很少使用解析解,而是采用像牛顿方法更快的方法。

如果您要更改优化问题,则情况并非如此。存在某些类型的问题,我们通常可以找到最佳值(这些问题中最大的类称为凸优化问题 - 尽管存在许多非凸问题,我们可以在某些条件下找到最佳值)。

如果您有兴趣了解更多信息,请查看Boyd和Vandenberghe的Convex Optimization。第一章不需要太多的数学背景,它概述了一般优化问题以及它与线性和凸规划等可解决优化问题的关系。

答案 1 :(得分:2)

我想用另一种方法来完成答案,以便找到适合R ^ 3中的一组点的最佳平面。 实际上,lstsq方法非常有效,除非在特定情况下(例如,所有点的x坐标均为0(或相同))。在这种情况下,lstsq中使用的A矩阵的列不是线性独立的。例如:

A = [[ 0   y_0    1]
     [ 0   y_1    1]
     ...
     [ 0   y_k    1] 
     ...
     [ 0   y_N    1]]

要避免此问题,可以直接在点集的中心坐标上使用svd。实际上,svd用于lstsq,但不在同一矩阵中使用。

这是一个Python示例,给出了coords数组中点的坐标:

# barycenter of the points
# compute centered coordinates
G = coords.sum(axis=0) / coords.shape[0]

# run SVD
u, s, vh = np.linalg.svd(coords - G)

# unitary normal vector
u_norm = vh[2, :]

使用这种方法,vh矩阵是3x3矩阵,其行中包含正交向量。前两个向量在平面中形成正交基,第三个向量是垂直于平面的单位向量。

如果您确实需要a, b, c参数,则可以从法向矢量获取它们,因为法向矢量的坐标为(a, b, c),假设平面的方程为ax + by + cz + d = 0