我有以下两个变量,我试图用每个观察的个体权重来计算失业率。下面的第一个变量显示给予每个受访者的权重,而第二个变量显示该人是否失业,其中 1 表示个人失业,0 表示他们在工作。最后,LF_status 以字符串形式表示劳动力状况。
dataex (ind_wt unemp_status) LF_status
.42645285 0 emp
.11840937 1 unemp
.11849173 0 emp
1.49918 1 unemp
我接受了 Cybernike 的帖子,对于所有观察,新创建的加权失业变量的值如下所示,这有意义吗?
egen unemployment_weighted= wtmean(unemp_status), weight(ind_wt)
dataex unemployment_weighted
.3786077
.3786077
.3786077
.3786077
答案 0 :(得分:2)
您可以使用 SSC 的 _GWTMEAN
包来执行此操作。可能还有其他方法。
ssc install _gwtmean
egen wanted = wtmean(unemp_status), weight(ind_wt)
. list
+--------------------------------+
| ind_wt unemp_~s wanted |
|--------------------------------|
1. | .4264528 0 .5549336 |
2. | .1184094 . .5549336 |
3. | .1184917 0 .5549336 |
4. | 1.49918 0 .5549336 |
5. | .7357956 . .5549336 |
|--------------------------------|
6. | .8300208 0 .5549336 |
7. | 4.741648 0 .5549336 |
8. | 9.495796 1 .5549336 |
+--------------------------------+