我想知道使用svyglm
或加权glm
之间的区别。
例如:
M1 = glm(formula = yy ~ age + gender + country ,
family = binomial(link = "probit"),
data = P2013,
subset = (P2013$E27>=14 & P2013$E27<=17),
weights = P2013$PESOANO)
或将样本设计定义为:
diseño = svydesign(id =~ NUMERO,
strata =~ ESTRATOGEO,
data = p2013,
weights = P2013$PESOANO)
diseño_per_1417 = subset(diseño, (P2013$E27>=14 & P2013$E27<=17))
然后使用svyglm
:
M2 = svyglm(formula = yy ~ age + gender + country,
family = quasibinomial(link = "probit"),
data = P2013,
subset = (stratum=!0),
design = diseño_per_1417)
如果我使用M2
(svyglm
)。我可以使用什么来比较逐步模型对glm模型的影响?
谢谢, 纳塔利娅
答案 0 :(得分:2)
来自help(glm)
:
非NULL权重可用于表示不同的观察具有不同的分散(权重值与分散度成反比);或者等价地,当权重元素是正整数w_i时,每个响应y_i是w_i单位权重观察的平均值。对于二项式GLM,当响应是成功的比例时,先前的权重用于给出试验次数:它们很少用于泊松GLM。
我不认为你在寻找那些重量。从你的例子来看,你似乎正在处理分层调查。你绝对应该使用surveyglm
。