按ID分组观察,同时也创建特征变量

时间:2017-01-19 14:31:14

标签: stata survey dummy-variable

我正在为厄瓜多尔的个人进行调查,我想分析每个家庭的特征。每个人都有一个houseID,所以我想我需要使用该变量对它们进行分组,同时还要创建一些关于其特征的额外变量:例如,如果家庭有两个女性或更多,则假人为1。我将在下面发布一个例子。

我知道如何在R(group_by)中执行此操作,但我没有在Stata中找到类似的命令。

我的数据的简化版本是:

houseID         femaleDummy   maleDummy
10000000001     1             0
10000000001     1             0
10000000001     0             1
10000000002     0             1
10000000002     0             1

我想得到像

这样的东西
houseID         twoFemalesormoreDummy
10000000001     1
10000000002     0

1 个答案:

答案 0 :(得分:2)

非常容易我的朋友

gen d_female = femaleDummy == 1   
bysort houseID: egen total_female = total(d_female)
bysort houseID: gen dummy = total_female >= 2