我在上面遇到了一些麻烦(计算R中随时间的发病率数据的泊松回归)。费率结果是每100000,我想知道是否适合进行调整glm((Cancer_Incidence_Rate/100000)~time, family = poisson)
请提前感谢您提供有关该主题的任何信息或解释。
答案 0 :(得分:0)
泊松回归是一种预测正整数的方法。数据是数据吗?如果你想用泊松回归预测率并且你没有整数,那么你可以舍入率:
glm((round(Cancer_Incidence_Rate/100000))~time, family = poisson)
您能否提供有关数据分布的更多信息?
答案 1 :(得分:0)
您不应该将费率除以常数;事实上,这可能会导致错误的P值和显着性水平。如果不同的观察结果代表不同的人数/总暴露量,您应该做的是考虑暴露。您可以通过将响应建模为每单位曝光率,并将曝光用作权重来实现此目的; 或使用(log-)曝光作为偏移。
关于偏差在泊松回归中的作用,请参见my post on CrossValidated。