我是R语言的新手,我正在努力提高自己的技能。目前,我遇到了一个非常简单的问题(希望如此)。
背景
在我的数据中,变量P21,PONDERA和ESTADO的长度相同...
我正在使用一个巨大的数据库,我想计算平均收入。在我的数据中,P21
指的是样本中某个条目的值,而我试图做的就是对其加权,以使其代表整个总体。反过来,ESTADO == 1
表示该人被占用,这就是为什么权重与忙碌的人有关。然后我将其除以人口,得到平均收入。
Salario_OP <- Base_total %>%
group_by(ANO4) %>%
summarise(Ingreso = sum(P21*(PONDERA[ESTADO == 1))/sum(PONDERA[ESTADO == 1]))
我真的认为这很容易解决,但是这种语言并不能帮助我理解所有内容(我是阿根廷人)。 希望您能够帮助我。预先感谢您的帮助!
答案 0 :(得分:1)
将PONDERA
子集为[ESTADO == 1]
时,其长度不再与P21
相同。您还需要对P21
进行子集设置。试试:
Salario_OP <- Base_total %>%
group_by(ANO4) %>%
summarise(Ingreso = sum(P21[ESTADO == 1]*(PONDERA[ESTADO == 1]))/sum(PONDERA[ESTADO == 1]))