在R中使用glm时出错

时间:2017-04-14 00:45:23

标签: r

我正在尝试在我从Kaggle下载的json数据中应用简单的二项逻辑回归:

https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/data

如果值为“high”,我将interest_level列的值更改为1,否则为0。 这是我第一次使用glm,所以欢迎任何帮助。

library(rjson)
library(dplyr)
library(purrr)
library(nnet)

json.data <- fromJSON(file = "train.json")
json.data = as.data.frame(t(do.call(rbind, json.data)))
#head(json.data)
#colnames(json.data)
x <- json.data$interest_level
for (i in 1:length(x)){
  if (json.data$interest_level[i] =="high"){
    json.data$interest_level[i] <- 1
  }else {json.data$interest_level[i] <- 0}
}
indexes = sample(1:nrow(json.data), size=0.5*nrow(json.data))
train.data <- json.data[indexes,]
test.data <- json.data[-indexes,]
model <-    glm(train.data~interest_level,family=binomial(link='logit'),data=train.data)

我收到此错误消息:

Error in model.frame.default(formula = train.data ~ interest_level, data =   train.data,  : invalid type (list) for variable 'train.data'

0 个答案:

没有答案