变量长度不同(找到'x')

时间:2016-01-05 03:32:37

标签: r regression

我已经看到了这个错误的几个案例,但它们似乎都没有解决或适用于我的情况。

我正在使用biglm构建逻辑回归模型。

我有一个带有〜250个变量和一百多万行的data.frame。

由于bigglm()无法使用点符号来选择模型中的所有变量,因此我正在构建类似this的公式。

因此,如果f是我的公式且df是我的数据框,那么我的模型如下所示:

fit <- bigglm(f, data = df, family=binomial(link="logit"), chunksize=100, maxit=10)

我收到错误:variable lengths differ (found for 'x')

当我检查x的长度时,它与df的长度完全相同。

其他StackOverflow问题似乎表明它可能是公式构建方式的问题。或许这可能是biglm?

的问题

1 个答案:

答案 0 :(得分:0)

我能够通过对Process myProcess = new Process(); myProcess.StartInfo.FileName = "acroRd32.exe"; //not the full application path myProcess.StartInfo.Arguments = "/A \"page=2=OpenActions\" C:\\example.pdf"; myProcess.Start();

构建公式的方式稍作修改来解决这个问题

如我在问题中所附的链接所示,我正在构建这样的公式:

bigglm()

缺少的n <- names(df) f <- as.formula(paste("y ~", paste(n[!n %in% "y"], collapse = " + "))) 是公式中每个变量名称前的f。修改df$函数以将as.formula()连接到每个变量名称可修复此问题。