在glmnet()中,我必须指定原始X矩阵和响应向量Y(不同于lm,您可以在其中指定模型公式)。 model.matrix()将正确地从X矩阵中删除不完整的观察结果,但它不包括输出对象中的响应。所以我会有这样的事情:
mydf
glmnet(y = mydf$response, x = model.matrix(myformula, mydf)[,-1], ...)
当model.matrix移除观察时,y和x维度将不匹配。是否有将y数据与x对齐的功能?
答案 0 :(得分:2)
尝试使用model.frame
和model.response
。
> d <- data.frame(y=rnorm(3), x=c(1,NA,2), z=c(NA, NA, 1))
> d
y x z
1 -0.6257260 1 NA
2 -0.4979723 NA NA
3 -1.2233772 2 1
> form <- y~x
> mf <- model.frame(form, data=d)
> model.response(mf)
1 3
-0.625726 -1.223377
> model.matrix(form, mf)
(Intercept) x
1 1 1
3 1 2
attr(,"assign")
[1] 0 1
我不熟悉glmnet
,mf
就足够了,只需传递y=mf[1,]
和x=mf[-1,]
。