我正在研究一个问题,要求我通过使用我的自变量的权重来解决我的因变量(小时工资)的加权平均值(这是一个具有16个类别且超过300,000个观测值的离散变量) 。你可以在下面看到。 enter image description here
我想如何为具有如此多观察值的变量生成加权变量?
答案 0 :(得分:1)
首先,您应确定 x 的权重是采样权重,频率权重还是分析权重。然后,如果 y 是您的因变量且 x_weights 是包含自变量权重的变量,请输入:
mean y [pweight = x_weight]
用于抽样(概率)权重
mean y [fweight = x_weight]
mean y [aweight = x_weight]
您可以找到这些不同选项here的精彩摘要,以及有关更专业的选项iweight
的信息。