Question

我有以下两个变量，我试图用每个观察的个体权重来计算失业率。下面的第一个变量显示给予每个受访者的权重，而第二个变量显示该人是否失业，其中 1 表示个人失业，0 表示他们在工作。最后，LF_status 以字符串形式表示劳动力状况。

dataex (ind_wt   unemp_status)   LF_status
.42645285         0                emp
 .11840937        1                unemp
 .11849173        0                emp
   1.49918        1                unemp

我接受了 Cybernike 的帖子，对于所有观察，新创建的加权失业变量的值如下所示，这有意义吗？

egen unemployment_weighted= wtmean(unemp_status), weight(ind_wt)
dataex unemployment_weighted
.3786077
.3786077
.3786077
.3786077

Answer 1

您可以使用 SSC 的 _GWTMEAN 包来执行此操作。可能还有其他方法。

ssc install _gwtmean

egen wanted = wtmean(unemp_status), weight(ind_wt)

. list

     +--------------------------------+
     |   ind_wt   unemp_~s     wanted |
     |--------------------------------|
  1. | .4264528          0   .5549336 |
  2. | .1184094          .   .5549336 |
  3. | .1184917          0   .5549336 |
  4. |  1.49918          0   .5549336 |
  5. | .7357956          .   .5549336 |
     |--------------------------------|
  6. | .8300208          0   .5549336 |
  7. | 4.741648          0   .5549336 |
  8. | 9.495796          1   .5549336 |
     +--------------------------------+

计算每个观察的加权平均值 (Stata)

1 个答案: