假设我想预测对解释变量的特定值的响应。但我不明白为什么我使用type =“response”或“terms”或“link”。
答案 0 :(得分:4)
假设您正在谈论GLM,您应首先了解模型的构建方式以及它与因变量的关系。这是一个广泛的话题,值得在大学全程讲课。我的建议是拿起一本书然后从那里开始。
简而言之,为了让数学出来,你需要将y
包装成某个函数,这样在等式的右边就可以得到一个好的" ,例如f(y) = beta_0 + beta_1 * X1 + beta_2 * X2 + e
类型公式。
ldose <- rep(0:5, 2)
numdead <- c(1, 4, 9, 13, 18, 20, 0, 2, 6, 10, 12, 16)
sex <- factor(rep(c("M", "F"), c(6, 6)))
SF <- cbind(numdead, numalive = 20-numdead)
budworm.lg <- glm(SF ~ sex*ldose, family = binomial)
现在,当您要求predict
返回type = link
时,您会获得f(y)
的值。
predict(budworm.lg, type = "link")
1 2 3 4 5 6
-2.8185550 -1.5596055 -0.3006561 0.9582933 2.2172427 3.4761922
7 8 9 10 11 12
-2.9935418 -2.0875053 -1.1814689 -0.2754324 0.6306040 1.5366404
响应将解决此术语,以便它在&#34;自然&#34;规模。
predict(budworm.lg, type = "response")
1 2 3 4 5 6
0.05632970 0.17370326 0.42539710 0.72277997 0.90178726 0.97000272
7 8 9 10 11 12
0.04771849 0.11031718 0.23478819 0.43157393 0.65262640 0.82297581
type = terms
将返回一个矩阵,给出每个观测值在线性标度上的拟合。
predict(budworm.lg, type = "terms")
sex ldose sex:ldose
1 0.08749339 -2.2650911 -0.44114124
2 0.08749339 -1.3590547 -0.08822825
3 0.08749339 -0.4530182 0.26468474
4 0.08749339 0.4530182 0.61759773
5 0.08749339 1.3590547 0.97051072
6 0.08749339 2.2650911 1.32342371
7 -0.08749339 -2.2650911 -0.44114124
8 -0.08749339 -1.3590547 -0.44114124
9 -0.08749339 -0.4530182 -0.44114124
10 -0.08749339 0.4530182 -0.44114124
11 -0.08749339 1.3590547 -0.44114124
12 -0.08749339 2.2650911 -0.44114124
attr(,"constant")
[1] -0.199816