我想在R中拟合一个模型,在该模型中我需要同时应用两个权重。假设我的模型是glm(y ~ x1 + male + East_Germany)
,其中男性标识了受访者的性别,而东德还是一个二进制变量,用于检查是否有人居住在东德。
现在让我们说一下,女性和东德人在我的数据中都被大大地遗漏了。假设这不是由于数据收集过程有缺陷,我将不得不施加两个权重。但是我真的可以像这样同时指定两个权重吗? glm(y ~ x1 + male + East_Germany, weight=c("male_wgt","east_wgt"))
我的想法是对整个数据或整个模型应用 one 权重已经改变了整个数据结构,但是我可能是错的。让我们举个例子:
y x1 male east male_weight east_weight
5 4 0 1 5 2
3 2 1 1 1 2
9 7 1 0 1 1
4 8 1 0 1 1
1 3 1 0 1 1
6 4 1 0 1 1
......,其中male==1
的意思是“男性”,而male==0
的意思是“女性”,我们假设两种性别的代表比例均相同(50%),而east==1
的意思是“东德”,east==0
也是“西德”,在这里,为简单起见,我们也假定两者应均等地代表。 y
和x
只是随机数。
我想知道如何同时应用这两个权重,因为如果我说“让第一行数五次,以便让女性获得更多的体重”,我同时会给东德权重(甚至没有应用east_weight
)。原因是,如果我们对第一行进行五次计数,最终将得到新的东西方比率6:4。还是我弄错了?