在我的数据集中,我目前在性别变量中有标记为男性和女性。
由于我要运行一个回归模型,我想改变它,所以男性和女性被重新编码显示为0和1.但是,我不知道该怎么做!
任何帮助非常感谢
答案 0 :(得分:0)
你需要这样的事情:
recode gender (X = 0) (Y = 1), gen(gender_dummy)
其中X和Y是您要重新编码的值。您可以发出label list
来查找编码内容。
答案 1 :(得分:0)
您声明您的性别变量是数字,带有标签。要确定数值,请使用无标签列表
tab gender, nolabel
让我们假设输出显示性别变量编码为男性== 1且女性== 2。要将其重新编码为0和1,我将创建一个名为 female 的新二分变量,其中female == 1且male == 0。
gen female=.
replace female=1 if gender==2
replace female=0 if gender==1
如果您想要为新的 female 变量添加标签,可以通过定义新标签并将其分配给变量来实现:
label define FEMALE 1 "female" 0 "male"
label values female FEMALE
然后,您可以通过使用和不使用标签进行制表来测试:
tab female
tab female, nolabel
如果您不再需要原始性别变量,则可以删除它:
drop gender
如果您愿意,可以将新的女性变量重命名为 gender ,但它通常建议您在命名之后命名二分变量无论什么值被编码为1,所以我将其留作女性。
rename female gender