编程语言R:库方法'黄土'中'权重'参数的含义

时间:2015-07-11 10:52:59

标签: r loess non-linear-regression

我使用R编程语言的库方法[/uvm]进行非参数数据拟合。数据集是二维的。我没有找到方法参数loess的任何适当文档。

我的数据点是正态分布的随机变量,我也估计了它们各自的标准偏差。我想知道参数weights是否允许我向R提供标准偏差的细节。换句话说:我想知道weights中的单个权重是否是(相对)数据质量的度量,因此如果通过参数weights提供了一些数据不确定性度量,则可以改善拟合。 / p>

编辑:我怀疑weights中的条目被用作LOESS过程中局部数据集的加权最小二乘回归中的权重(可能作为(位置相关的)核函数的附加权重前因子?)。这表明,对于数据点的情况,这些数据点是独立的正态分布的随机变量,但仍然具有不同的噪声水平(即不同的标准偏差)(如我的情况),权重应选择为weights,其中1/\sigma_{i}^2是相应随机变量/数据点的标准偏差。如果有人确切知道,那就太好了。

1 个答案:

答案 0 :(得分:1)

此页面证实了我的怀疑:

https://docs.tibco.com/pub/enterprise-runtime-for-R/3.1.0/doc/html/Language_Reference/stats/loess.html

关于weights的参数loess,它说:

  

用于赋予个别观察值的权重的可选表达式   在形成局部拟合的残差平方和中   标准即可。默认情况下,执行未加权的拟合。如果是   提供,权重被视为表达,以评估相同   数据框作为模型公式。它应该评估为非负面的   数字向量。 如果不同的观察结果具有不等的差异,   权重应与方差成反比