在R中对lm()或glm()使用多个权重

时间:2018-10-04 15:41:46

标签: r regression glm

我想在R中拟合一个模型,在该模型中我需要同时应用两个权重。假设我的模型是glm(y ~ x1 + male + East_Germany),其中男性标识了受访者的性别,而东德还是一个二进制变量,用于检查是否有人居住在东德。

现在让我们说一下,女性和东德人在我的数据中都被大大地遗漏了。假设这不是由于数据收集过程有缺陷,我将不得不施加两个权重。但是我真的可以像这样同时指定两个权重吗? glm(y ~ x1 + male + East_Germany, weight=c("male_wgt","east_wgt"))

我的想法是对整个数据或整个模型应用 one 权重已经改变了整个数据结构,但是我可能是错的。让我们举个例子:

y   x1   male   east   male_weight   east_weight
5   4    0      1      5             2
3   2    1      1      1             2
9   7    1      0      1             1
4   8    1      0      1             1
1   3    1      0      1             1
6   4    1      0      1             1

......,其中male==1的意思是“男性”,而male==0的意思是“女性”,我们假设两种性别的代表比例均相同(50%),而east==1的意思是“东德”,east==0也是“西德”,在这里,为简单起见,我们也假定两者应均等地代表。 yx只是随机数。

我想知道如何同时应用这两个权重,因为如果我说“让第一行数五次,以便让女性获得更多的体重”,我同时会给东德权重(甚至没有应用east_weight)。原因是,如果我们对第一行进行五次计数,最终将得到新的东西方比率6:4。还是我弄错了?

0 个答案:

没有答案