我已经看到了这个错误的几个案例,但它们似乎都没有解决或适用于我的情况。
我正在使用biglm
构建逻辑回归模型。
我有一个带有〜250个变量和一百多万行的data.frame。
由于bigglm()
无法使用点符号来选择模型中的所有变量,因此我正在构建类似this的公式。
因此,如果f
是我的公式且df
是我的数据框,那么我的模型如下所示:
fit <- bigglm(f, data = df, family=binomial(link="logit"), chunksize=100, maxit=10)
我收到错误:variable lengths differ (found for 'x')
当我检查x
的长度时,它与df
的长度完全相同。
其他StackOverflow问题似乎表明它可能是公式构建方式的问题。或许这可能是biglm?
答案 0 :(得分:0)
我能够通过对Process myProcess = new Process();
myProcess.StartInfo.FileName = "acroRd32.exe"; //not the full application path
myProcess.StartInfo.Arguments = "/A \"page=2=OpenActions\" C:\\example.pdf";
myProcess.Start();
如我在问题中所附的链接所示,我正在构建这样的公式:
bigglm()
缺少的n <- names(df)
f <- as.formula(paste("y ~", paste(n[!n %in% "y"], collapse = " + ")))
是公式中每个变量名称前的f
。修改df$
函数以将as.formula()
连接到每个变量名称可修复此问题。