Question

我的具体问题是为什么'model.matrix（）'没有像'bigglm（）'那样按预期工作。

相同的模型矩阵在glm中工作正常：

temp <- model.matrix(~ ORGN_FLOW_INT + work_attract + MINS, data=HTWAF_sample)
sim2 <- glm(FLOW_INT ~ temp, family=poisson(link="log"), data=HTWAF_sample)

这很好用。

但在'bigglm（）'中，相同的命令会收到错误：

temp <- model.matrix(~ ORGN_FLOW_INT + work_attract + MINS, data=HTWAF_sample)
sim2 <- bigglm(FLOW_INT ~ temp, family=poisson(link="log"), data=HTWAF_sample)

Error in model.frame.default(tt, chunk): variable lengths differ (found for 'temp')

更一般地说，我会以概念上正确的方式请求如何在lm / glm侧使用'model.matrix（）'的示例。我在网上搜索了一些例子并阅读了'model.matrix（）'的文档，但我似乎无法找到关于如何与lm / glm一起使用model.matrix（）的高质量示例。我上面的方法来自反复试验。

顺便说一句，如果你想知道我为什么要使用'model.matrix（）'，那是因为我有一个1900个不同值的因子变量。

在R中使用带有bigglm的model.matrix

0 个答案: