我正在尝试在数据集上使用glmnet
包。我正在使用cv.glmnet()
获取glmnet()
的lambda值。我将第1,2,7,12列排除在外:id列,响应列,包含NA,并包含NA。
这是数据集和错误消息:
> head(t2)
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
1 1 1 0.7661266 45 2 0.80298213 9120 13 0 6 0 2
2 2 0 0.9571510 40 0 0.12187620 2600 4 0 0 0 1
3 3 0 0.6581801 38 1 0.08511338 3042 2 1 0 0 0
4 4 0 0.2338098 30 0 0.03604968 3300 5 0 0 0 0
5 5 0 0.9072394 49 1 0.02492570 63588 7 0 1 0 0
6 6 0 0.2131787 74 0 0.37560697 3500 3 0 1 0 1
> str(t2)
'data.frame': 150000 obs. of 12 variables:
$ X1 : int 1 2 3 4 5 6 7 8 9 10 ...
$ X2 : int 1 0 0 0 0 0 0 0 0 0 ...
$ X3 : num 0.766 0.957 0.658 0.234 0.907 ...
$ X4 : int 45 40 38 30 49 74 57 39 27 57 ...
$ X5 : int 2 0 1 0 1 0 0 0 0 0 ...
$ X6 : num 0.803 0.1219 0.0851 0.036 0.0249 ...
$ X7 : int 9120 2600 3042 3300 63588 3500 NA 3500 NA 23684 ...
$ X8 : int 13 4 2 5 7 3 8 8 2 9 ...
$ X9 : int 0 0 1 0 0 0 0 0 0 0 ...
$ X10: int 6 0 0 0 1 1 3 0 0 4 ...
$ X11: int 0 0 0 0 0 0 0 0 0 0 ...
$ X12: int 2 1 0 0 0 1 0 0 NA 2 ...
> cv1 <- cv.glmnet(as.matrix(t2[,-c(1,2,7,12)]), t2[,2], family="binomial")
Error in as.matrix(cbind2(1, newx) %*% nbeta) :
error in evaluating the argument 'x' in selecting a method for function 'as.matrix': Error in t(.Call(Csparse_dense_crossprod, y, t(x))) :
error in evaluating the argument 'x' in selecting a method for function 't': Error: invalid class 'NA' to dup_mMatrix_as_dgeMatrix
> cv1 <- cv.glmnet(as.matrix(t2[,-c(1,2,7,12)]), t2[,2], family="multinomial")
Error in t(.Call(Csparse_dense_crossprod, y, t(x))) :
error in evaluating the argument 'x' in selecting a method for function 't': Error: invalid class 'NA' to dup_mMatrix_as_dgeMatrix
有什么建议吗?
答案 0 :(得分:20)
出于某种原因,glmnet更喜欢data.matrix()
到as.matrix()
cv1 <- cv.glmnet(data.matrix(t2[,-c(1,2,7,12)]), t2[,2], family="multinomial")
应该做的。
答案 1 :(得分:6)
使用cv.glmnet时出现类似的错误消息。 cv.glmnet可以在RStudio中正常运行,但在使用Rscript时无法正常工作。我的修复是添加到我的脚本的顶部:
require(methods)
似乎&#34; glmnet&#34;包可能正在使用&#34;方法&#34;中的一些功能。包,但在使用Rscript时,在启动时不加载此包。然而,&#34;方法&#34;软件包通常默认加载到R。
以下是有关此Rscript功能的信息:
Rscript does not load methods package, R does -- why, and what are the consequences?
我希望这可以帮助遇到与我相同问题的人。
答案 2 :(得分:5)
我得到了同样的错误消息。不幸的是,它并不像我使用data.matrix()那么容易。
错误发生在输入矩阵和模型系数的交叉积中。
在predict.glmnet:
nfit = as.matrix(cbind2(1,newx)%*%nbeta)
解决了我的问题是迫使x进入dgCMatrix。我真的不明白为什么,但它对我有用。
predict(object = lm, newx = as(x, "dgCMatrix"), type = "response")
由于我没有将这个问题视为关于该错误的众多问题之一的答案,我认为我会将其发布在此处。