R中是否存在具有3个以上参数预测因子的黄土或具有类似效果的技巧?

时间:2011-06-16 10:24:23

标签: r local global regression loess

致电本地回归和/或 R 的所有专家!

我在 R 中遇到了标准 loess 功能的限制,希望您有一些建议。当前的实现仅支持1-4个预测变量。让我列出我们的应用场景,以说明为什么一旦我们想要使用全局适合的参数协变量,这很容易成为一个问题。

基本上,我们在一些测量 z 上覆盖了空间失真 s(x,y)

z_i = s(x_i,y_i) + v_{g_i}

这些测量 z 可以按照每组 g 的相同基础未失真测量值 v 进行分组。每个度量都知道组成员资格g_i,但组的基础未失真测量值v_g是未知的,应由(全局,而不是本地)回归确定。

我们需要估计二维空间趋势 s(x,y),然后我们要删除它们。在我们的应用程序中,假设在最简单的情况下,每组至少有35组测量值。测量随机放置。以第一组为参考,因此有19个未知偏移。

以下玩具数据代码(一维空间趋势 x )适用于两个或三个偏移组。

不幸的是, loess 调用因四个或更多偏移组而失败,并显示错误消息

Error in simpleLoess(y, x, w, span, degree, parametric, drop.square,
normalize,  :
  only 1-4 predictors are allowed"

我尝试重写限制并获得

k>d2MAX in ehg136.  Need to recompile with increased dimensions.

这样做有多容易?我无法在任何地方找到 d2MAX 的定义,似乎这可能是硬编码的 - 错误显然是由 loessf.f

中的第1359行触发的
if(k .gt. 15)   call ehg182(105)

或者,是否有人知道可以在此处应用的全局(参数)偏移组的局部回归实现?

或者有更好的方法来解决这个问题吗?我尝试使用相关结构 lme ,但这似乎要慢得多。

非常感谢任何评论!

非常感谢,
大卫

###
#
# loess with parametric offsets - toy data demo
#

x<-seq(0,9,.1);
x.N<-length(x);

o<-c(0.4,-0.8,1.2#,-0.2  # works for three but not four
     );  # these are the (unknown) offsets
o.N<-length(o);
f<-sapply(seq(o.N),
          function(n){
            ifelse((seq(x.N)<= n   *x.N/(o.N+1) &
                    seq(x.N)> (n-1)*x.N/(o.N+1)),
                    1,0);
          });
f<-f[sample(NROW(f)),];

y<-sin(x)+rnorm(length(x),0,.1)+f%*%o;
s.fs<-sapply(seq(NCOL(f)),function(i){paste('f',i,sep='')});
s<-paste(c('y~x',s.fs),collapse='+');
d<-data.frame(x,y,f)
names(d)<-c('x','y',s.fs);

l<-loess(formula(s),parametric=s.fs,drop.square=s.fs,normalize=F,data=d,
         span=0.4);
yp<-predict(l,newdata=d);
plot(x,y,pch='+',ylim=c(-3,3),col='red');  # input data
points(x,yp,pch='o',col='blue');           # fit of that

d0<-d; d0$f1<-d0$f2<-d0$f3<-0;
yp0<-predict(l,newdata=d0);
points(x,y-f%*%o);     # spatial distortion
lines(x,yp0,pch='+');  # estimate of that

op<-sapply(seq(NCOL(f)),function(i){(yp-yp0)[!!f[,i]][1]});

cat("Demo offsets:",o,"\n");
cat("Estimated offsets:",format(op,digits=1),"\n");

1 个答案:

答案 0 :(得分:4)

为什么不为此使用添加剂模型?包 mgcv 将处理这种模型,如果我理解你的问题,就好了。我可能有这个错误,但你显示的代码与x~y有关,但你的问题提到z~s(x,y)+ g。我在gam()下面显示的内容是响应z,由xy中的空间平滑建模,g以参数方式估算,{{1}存储为数据框中的因子:

g

或者我误解了你想要的东西?如果你想发布一小段数据,我可以使用 mgcv 来提供一个正确的例子......?