我在R中的包glmnet
有问题。我正在尝试使用它但是我遇到了以下问题:
{
> names(mtcars)
#lasso
## 75% of the sample size
> smp_size <- floor(0.75 * nrow(mtcars))
## set the seed to make your partition reproductible
> set.seed(123)
> train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)
> train <- mtcars[train_ind, ]
> names(train)
> y<-train["hp"]
> c(y)
> yvector<-c(y)
> is.vector(yvector)
> grid=10^seq(10,-2,length=24)
> lasso.mod=glmnet(train,yvector, alpha=1, lambda=grid)
glmnet错误(train,yvector,alpha = 1,lambda = grid):number y(1)中的观测值不等于x(24)
的行数
> lasso.mod=glmnet(train,y, alpha=1, lambda=grid)
weighted.mean.default(y,权重)出错:'x'和'w'必须有 相同的长度
> lasso.mod=glmnet(train,train, alpha=1, lambda=grid)
weighted.mean.default(y,权重)出错:'x'和'w'必须有 相同的长度}
每次我更改y的最后一行(glmnet程序)(以相同的长度输入矩阵或向量)时,它会重复最后三个错误!我该怎么办?
答案 0 :(得分:1)
在这一行
y <- train["hp"]
结果是包含一个变量(hp
)的数据框。你想要的是将变量提取到一个向量中:
y <- train[["hp"]]
# or
y <- train$hp
您还可以使用我的glmnetUtils包来处理设置响应向量和模型矩阵的机制。
devtools::install_github("hong-revo/glmnetUtils")
library(glmnetUtils)
lasso.mod <- glmnet(hp ~ ., data=train, alpha=1, lambda=grid)