我正在为厄瓜多尔的个人进行调查,我想分析每个家庭的特征。每个人都有一个houseID,所以我想我需要使用该变量对它们进行分组,同时还要创建一些关于其特征的额外变量:例如,如果家庭有两个女性或更多,则假人为1。我将在下面发布一个例子。
我知道如何在R(group_by)中执行此操作,但我没有在Stata中找到类似的命令。
我的数据的简化版本是:
houseID femaleDummy maleDummy
10000000001 1 0
10000000001 1 0
10000000001 0 1
10000000002 0 1
10000000002 0 1
我想得到像
这样的东西houseID twoFemalesormoreDummy
10000000001 1
10000000002 0
答案 0 :(得分:2)
非常容易我的朋友
gen d_female = femaleDummy == 1
bysort houseID: egen total_female = total(d_female)
bysort houseID: gen dummy = total_female >= 2