Stata和R结果在Logistic回归中与两个分类预测因子及其相互作用不匹配

时间:2011-08-12 22:53:15

标签: r stata glm

当我试图比较Stata和R的结果时,我感到很困惑。我正在使用网页上给出的示例http://www.ats.ucla.edu/stat/stata/webbooks/logistic/chapter2/default.htm 首先在Stata中运行以下命令

use http://www.ats.ucla.edu/stat/stata/webbooks/logistic/apilog, clear

然后使用以下部分中给出的命令(2.2.2 A 2 by 2布局,主要效果和交互)

generate cred_ed = cred_hl*pared_hl
logit hiqual cred_hl pared_hl cred_ed

这两个命令将产生网页上给出的结果。

然后我使用以下R代码重现相同的例子

Data<- read.csv("Book1.csv",header=T)
data.glm<-glm(hiqual~cred_hl + pared_hl + cred_hl*pared_hl,family=binomial,  data=Data)
summary(data.glm)

但结果不匹配!

R的数据文件可以从以下链接下载

https://spreadsheets.google.com/spreadsheet/ccc?key=0Ajt182RLsguldFlLQmd6Z1ZoczJCenJIdmREUkhxTFE&hl=en_US

注意:仅匹配主效应的模型的结果是匹配的,但是当我们包含交互时,它不匹配。

先谢谢。

1 个答案:

答案 0 :(得分:4)

他们给我相同的结果(使用ucla的数据)。

library(foreign)
d1 <- read.dta('http://www.ats.ucla.edu/stat/stata/webbooks/logistic/apilog.dta')
m1 <- glm(hiqual~cred_hl + pared_hl + cred_hl*pared_hl,family=binomial,  data=d1)