python数组:平均斜率和数据集截距

时间:2018-08-06 15:01:06

标签: python python-3.x numpy

我在实现以下目标方面遇到一些困难。假设我从测试中获得了两组数据:

    import numpy as np
    a = np.array([[0.0, 1.0, 2.0, 3.0], [0.0, 2.0, 4.0, 6.0]]).T
    b = np.array([[0.5, 1.5, 2.5, 3.5], [0.5, 1.5, 2.5, 3.5]]).T

其中,第0列中的数据代表(在我的情况下)位移,第1列中的数据代表各自的测得力值。

(给出的数据代表斜率分别为2和1的两条直线,y截距均为0。)

现在,我正在尝试编写一个脚本,该脚本尽管x值不匹配,但仍对这两个数组取平均值,从而可以产生

    c = [0.0, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5], [0.0, 0.75, 1.5,
         2.25, 3.0, 3.75, 4.5, 5.25]]).T

(斜率为1.5且y轴截距为0的线)

我尽力使用切片和线性插值法,但是似乎无法解决问题(我是初学者)。


对于任何输入和技巧,我将感到非常高兴,并希望我提供给您的信息足够!

谢谢,

罗伯特

1 个答案:

答案 0 :(得分:2)

您可以获取每个数据集的系数(斜率和截距),获取均值,然后将该数据拟合到x值的新数组中。

逐步:

将deg-1多项式拟合到每个数组a,并使用polyfit使用b获得每个数组(斜率和截距)的系数:

coef_a = np.polyfit(a[:,0], a[:,1], deg=1)

coef_b = np.polyfit(b[:,0], b[:,1], deg=1)

>>> coef_a
array([  2.00000000e+00,   2.22044605e-16])
>>> coef_b
array([  1.00000000e+00,   1.33226763e-15])

获取这些系数的均值以用作c的系数:

coef_c = np.mean(np.stack([coef_a,coef_b]), axis=0)

>>> coef_c
array([  1.50000000e+00,   7.77156117e-16])

使用np.arange为c创建新的x值

c_x = np.arange(0,4,0.5)

>>> c_x
array([ 0. ,  0.5,  1. ,  1.5,  2. ,  2.5,  3. ,  3.5])

使用polyval使新的c系数适合新的x值:

c_y = np.polyval(coef_c, c_x)

>>> c_y
array([  7.77156117e-16,   7.50000000e-01,   1.50000000e+00,
         2.25000000e+00,   3.00000000e+00,   3.75000000e+00,
         4.50000000e+00,   5.25000000e+00])

使用c_xc_ystack的值放在一起:

c = np.stack([c_x, c_y])

>>> c
array([[  0.00000000e+00,   5.00000000e-01,   1.00000000e+00,
          1.50000000e+00,   2.00000000e+00,   2.50000000e+00,
          3.00000000e+00,   3.50000000e+00],
       [  7.77156117e-16,   7.50000000e-01,   1.50000000e+00,
          2.25000000e+00,   3.00000000e+00,   3.75000000e+00,
          4.50000000e+00,   5.25000000e+00]])

如果将其四舍五入到小数点后两位,则会看到与所需结果相同的结果:

>>> np.round(c, 2)
array([[ 0.  ,  0.5 ,  1.  ,  1.5 ,  2.  ,  2.5 ,  3.  ,  3.5 ],
       [ 0.  ,  0.75,  1.5 ,  2.25,  3.  ,  3.75,  4.5 ,  5.25]])

在单个语句中:

c = np.stack([np.arange(0, 4, 0.5),
              np.polyval(np.mean(np.stack([np.polyfit(a.T[0], a.T[1], 1),
                                           np.polyfit(b.T[0], b.T[1], 1)]),
                                 axis=0),
                         np.arange(0, 4, 0.5))])

>>> c
array([[  0.00000000e+00,   5.00000000e-01,   1.00000000e+00,
          1.50000000e+00,   2.00000000e+00,   2.50000000e+00,
          3.00000000e+00,   3.50000000e+00],
       [  7.77156117e-16,   7.50000000e-01,   1.50000000e+00,
          2.25000000e+00,   3.00000000e+00,   3.75000000e+00,
          4.50000000e+00,   5.25000000e+00]])