我的具体问题是为什么'model.matrix()'没有像'bigglm()'那样按预期工作。
相同的模型矩阵在glm中工作正常:
temp <- model.matrix(~ ORGN_FLOW_INT + work_attract + MINS, data=HTWAF_sample)
sim2 <- glm(FLOW_INT ~ temp, family=poisson(link="log"), data=HTWAF_sample)
这很好用。
但在'bigglm()'中,相同的命令会收到错误:
temp <- model.matrix(~ ORGN_FLOW_INT + work_attract + MINS, data=HTWAF_sample)
sim2 <- bigglm(FLOW_INT ~ temp, family=poisson(link="log"), data=HTWAF_sample)
Error in model.frame.default(tt, chunk): variable lengths differ (found for 'temp')
更一般地说,我会以概念上正确的方式请求如何在lm / glm侧使用'model.matrix()'的示例。我在网上搜索了一些例子并阅读了'model.matrix()'的文档,但我似乎无法找到关于如何与lm / glm一起使用model.matrix()的高质量示例。我上面的方法来自反复试验。
顺便说一句,如果你想知道我为什么要使用'model.matrix()',那是因为我有一个1900个不同值的因子变量。