Question

我正在为厄瓜多尔的个人进行调查，我想分析每个家庭的特征。每个人都有一个houseID，所以我想我需要使用该变量对它们进行分组，同时还要创建一些关于其特征的额外变量：例如，如果家庭有两个女性或更多，则假人为1。我将在下面发布一个例子。

我知道如何在R（group_by）中执行此操作，但我没有在Stata中找到类似的命令。

我的数据的简化版本是：

houseID         femaleDummy   maleDummy
10000000001     1             0
10000000001     1             0
10000000001     0             1
10000000002     0             1
10000000002     0             1

我想得到像

这样的东西

houseID         twoFemalesormoreDummy
10000000001     1
10000000002     0

Answer 1

非常容易我的朋友

gen d_female = femaleDummy == 1   
bysort houseID: egen total_female = total(d_female)
bysort houseID: gen dummy = total_female >= 2

按ID分组观察，同时也创建特征变量

1 个答案: