R中设置的esoph数据包括两个名为ncontrols和ncases的字段,这两个字段是该组中的人数以及该组中被诊断患有食道癌的人数。 “示例”部分中的此语句创建了一个线性模型:
model1 <- glm(cbind(ncases, ncontrols) ~ agegp + tobgp*alcgp,
data=esoph, family=binomial())
我的问题是关于cbind
序列。根据ncases和ncontrols的值,它是否神奇地创建了零(否)和一(是)的辅助数组?
答案 0 :(得分:2)
“列将” ncases
和ncontrols
绑定到2列矩阵中,如下所示:
> head(esoph)
agegp alcgp tobgp ncases ncontrols
1 25-34 0-39g/day 0-9g/day 0 40
2 25-34 0-39g/day 10-19 0 10
3 25-34 0-39g/day 20-29 0 6
4 25-34 0-39g/day 30+ 0 5
5 25-34 40-79 0-9g/day 0 27
6 25-34 40-79 10-19 0 7
> head(cbind(esoph$ncases, esoph$ncontrols))
[,1] [,2]
[1,] 0 40
[2,] 0 10
[3,] 0 6
[4,] 0 5
[5,] 0 27
[6,] 0 7
这让模型知道有多少个案例在多少次试验中都是正面的,即什么是分子和分母。
答案 1 :(得分:0)
感谢上面的两位回应者。其他信息实际上在glm文档中,其中第一个参数的Details部分包括可能的规范“作为一个双列矩阵,列中给出了成功和失败的数量”。因此,我正在做我很好奇的工作而不是cbind。