我有一个数据集,其中我需要对两周内医生的就诊次数随年龄组的变化(即<30,介于30和50之间)进行泊松回归分析。和&gt; 50),性和疾病。保持性别和疾病数量的平均值不变。
以下是我的数据示例:
visits gender age illness
1 female 19 1
1 female 19 1
1 male 19 3
1 male 19 1
1 male 19 2
1 female 19 5
1 female 19 4
1 female 19 3
1 female 19 2
1 male 19 1
但是,由于我不知道如何正确输入这些组,所以我不知道该怎么做。因为我需要发现不同年龄组在两周内对医生的预期访问率。
我知道如何输入初始等式: glm(访问〜年龄+性别+疾病,数据= DoctorVisits,家庭= poisson)
但我不知道如何创建预测功能。
答案 0 :(得分:0)
假设你想预测男性21岁和疾病= 3
predict(your_glm,
newdata = data.frame(gender = "male", age = 21, illness = 3),
type = "response")
在这里,您基本上创建了一个数据框,其中包含您希望在函数内部进行预测的obseravations。如果您有多个观察结果需要进行预测,那么首先单独创建数据框然后将其提供给预测函数可能更为明智,只需将"newdata="
交换为"data="
。
type = "response"
会以与glm相同的格式给出预测,否则它将是log ods。