用因子创建矩阵lm模型

时间:2015-11-07 17:25:36

标签: r matrix lm

我想创建100个模拟并使用矩阵为每个模型创建线性模型。我使用了以下代码,但出现了错误。实现这一目标的最佳方法是什么?

n=15;nsims=100
factor=matrix(as.factor(rep(1:5,3)),n, nsims)
sim=matrix(rnorm(nfactor*nsims,0,1),n,nsims)
> dim(factor)
[1]  15 100
> lm1=lm(sim~factor)
Error in `[[<-.data.frame`(`*tmp*`, i, value = c(1L, 2L, 3L, 4L, 5L, 1L,  : 
  replacement has 1500 rows, data has 15

1 个答案:

答案 0 :(得分:3)

我不清楚你想要什么。

创建数据:

n <- 15; nsims <- 100; nfactor <- 5
f <- matrix(as.factor(rep(1:nfactor,n/nfactor)), n, nsims)
set.seed(101)
sim <- matrix(rnorm(nfactor*nsims,0,1),n,nsims)

(一般来说,使用现有函数的名称命名变量(factor)是不好的做法...)

res <- vector("list", nsims)
for (i in 1:nsims) {
   res[[i]] <- lm(y~x,
                  data=data.frame(y=sim[,i],x=f[,i]))
}

for循环可能看起来很笨,但是(正如R Inferno第4章所讨论的那样)它通常是编写代码的最清晰方式......如果你真的想要在没有for循环的情况下执行此操作,在f列可能不同的一般情况下,您可以这样做

res2 <- mapply(function(x,y) lm(y~x),
            split(f,col(f)),split(sim,col(sim)),SIMPLIFY=FALSE)

但我认为这不如for循环明确......

更新:我不知道它是否有意,但您的因子矩阵的每一列都是相同的。因此,您可以将单个输入变量放在公式的右侧,将矩阵响应放在左侧:

all(apply(f[,-1],2,identical,f[,1]))  ## all TRUE
res2 <- lm(sim~f[,1])