使用scipy(Python)将样条拟合到具有重复x的数据

时间:2017-01-09 14:36:49

标签: machine-learning regression interpolation curve-fitting spline

我正在尝试使用' interp1d'来对具有5700个数据样本(具有重复的x值,即x:水平轴)的数据拟合样条曲线。功能从包' scipy'在python中。我尝试使用低阶样条(k = 1)和二次样条(k = 2),三次样条(k = 3)。 我很震惊地看到了样条曲线的奇怪回应。在我的数据上。尽管样条在' k = 1'有些意义,但过于夸张(二次和三次样条表现得太差)。在我的第一次试验中,我使用多项式拟合来拟合数据,结果令人鼓舞。 我期待样条拟合会得到比我用多项式拟合更好的结果。This is the result with splines。 请建议我,我哪里错了?

1 个答案:

答案 0 :(得分:1)

如果数据集对每个X值具有单独的唯一值,则每个数据点的有效权重为1.0。但是,如果该数据集中的单个数据点加倍或复制,则该单个数据点的有效权重为2.0。

如果数据集中的所有数据点都被复制一次,则每个点的有效权重均为2.0 - 也就是说,所有数据点的权重都相同。

如果此数据集中的某些数据点具有唯一的X值且某些数据点出现不止一次,则一种方法是平均“重复”数据点的Y值,以便每个点的有效权重为1.0。这有时适用于我描述的特定情况。