如何将数据集分为X和Y,进行训练和测试,以便在训练集上进行逻辑回归

时间:2019-06-24 11:45:47

标签: r

我正在尝试将信用审批数据集分为培训和测试。 590行用于训练,其余用于测试。变量“ Y”将是批准的列,变量“ X”将是其余的列。

完成后,我需要在Train集合上进行逻辑回归。

 df.credit[,1:15]
 dim(X)
df.credit$Approved
    y <- as.numeric(df.credit$Approved)
    unique(Approved)
    y
    head(y,20)
    head(df.credit$Approved, 20)
    X_train <- X[1:590,]
    y_train <- y[1:590]
    X_test <- X[591:690,]
    y_test <- y[591:690]
    fit1 <- glm(Approved~., data=X_train)
    fit0 <- glm(Approved~1, data=X_train)
    library(MASS)
    step <-stepAIC(fit0,direction="forward",scope=list(upper=fit1,lower=fit0))
    step

当我尝试运行代码时,将显示下一个错误:

  

model.frame.default(formula = Approved〜。,data = X_train,drop.unused.levels = TRUE)中的错误:可变长度不同(为'Male'找到)

0 个答案:

没有答案