通过轨道数据拟合椭圆

时间:2015-03-10 11:57:58

标签: python scipy ellipse astronomy minimization

我为行星围绕太阳运行时的(x,y,z)坐标生成了一堆数据。现在我想通过这些数据拟合椭圆。

我试图做的事情:

我基于五个参数创建了一个虚拟椭圆:半长轴&定义尺寸和偏差的偏心率形状和三个旋转椭圆的欧拉角。由于我的数据并不总是以原点为中心,因此我还需要翻译需要额外三个变量(dx,dy,dz)的椭圆。 一旦我用这八个变量初始化这个函数,我就得到了这个椭圆上的N个点。 (N =我绘制椭圆的数据点数) 我计算这些虚拟点与实际数据的偏差,然后使用一些最小化方法最小化这种偏差,以找到这八个变量的最佳拟合值。

我的问题在于最后一部分:最小化偏差并找到变量的值。

为了最大限度地减少偏差,我使用 scipy.optimize.minimize 来尝试近似最佳拟合变量,但它只是做得不够好:

Here is an image Here is an image我的最佳状态是什么样的,并且具有非常慷慨准确的初始猜测。 (蓝色=数据,红色=适合)

Here is the entire code.(无需数据,它会生成自己的虚假数据)

简而言之,我使用这个scipy函数:

initial_guess = [0.3,0.2,0.1,0.7,3,0.0,-0.1,0.0]
bnds = ((0.2, 0.5), (0.1, 0.3), (0, 2*np.pi), (0, 2*np.pi), (0, 2*np.pi), (-0.5,0.5), (-0.5,0.5), (-0.3,0.3)) #reasonable bounds for the variables
result = optimize.minimize(deviation, initial_guess, args=(data,), method='L-BFGS-B', bounds=bnds, tol=1e-8) #perform minimalisation
semi_major,eccentricity,inclination,periapsis,longitude,dx,dy,dz = result["x"]

最小化此错误(或偏差)功能:

    def deviation(variables, data):
    """
    This function calculates the cumulative seperation between the ellipse fit points and data points and returns it
    """
    num_pts = len(data[:,0])
    semi_major,eccentricity,inclination,periapsis,longitude,dx,dy,dz = variables
    dummy_ellipse = generate_ellipse(num_pts,semi_major,eccentricity,inclination,periapsis,longitude,dz,dy,dz)
    deviations = np.zeros(len(data[:,0]))
    pair_deviations = np.zeros(len(data[:,0]))
    # Calculate separation between each pair of points
    for j in range(len(data[:,0])):
        for i in range(len(data[:,0])):
            pair_deviations[i] = np.sqrt((data[j,0]-dummy_ellipse[i,0])**2 + (data[j,1]-dummy_ellipse[i,1])**2 + (data[j,2]-dummy_ellipse[i,2])**2)
            deviations[j] = min(pair_deviations) # only pick the closest point to the data point j.
    total_deviation = sum(deviations)
    return total_deviation

(我的代码可能有点乱,效率低,我是新手)

我的编码可能会出现一些逻辑错误,但我认为它归结为 scipy.minimize.optimize 函数。我不知道它是如何工作的以及对它的期望。我还建议在处理这么多变量时尝试马尔可夫链蒙特卡罗。我确实看过 emcee ,但现在它已经超出了我的想象。

1 个答案:

答案 0 :(得分:1)

首先,你的目标函数中有一个拼写错误,阻止了其中一个变量的优化:

dummy_ellipse = generate_ellipse(...,dz,dy,dz)

应该是

dummy_ellipse = generate_ellipse(...,dx,dy,dz)

此外,取出sqrt并最小化欧氏距离的平方和使得优化器在数值上更容易。

由于BFGS求解器假设的min(),你的目标函数也无处可辨,因此它的性能不是最理想的。

此外,从分析几何角度解决问题可能有所帮助:3d中的椭圆被定义为两个方程的解

f1(x,y,z,p) = 0
f2(x,y,z,p) = 0

其中p是椭圆的参数。现在,为了使参数适合数据集,您可以尝试最小化

F(p) = sum_{j=1}^N [f1(x_j,y_j,z_j,p)**2 + f2(x_j,y_j,z_j,p)**2]

其中总和超过数据点。

更好的是,在这个问题公式中你可以使用optimize.leastsq,这可能在最小二乘问题上更有效。