重新编码缺失值

时间:2019-09-17 14:04:05

标签: stata

我有一个大数据集,其中包含缺少值的变量。缺失值的编码方式不同,例如.b.f等。即使在同一变量内也会发生这种情况。

我正在尝试使用此命令为所有变量提供一个代码:

replace bmi=.a if bmi==.b | bmi==.f
replace age=.a if age==.b | age==.f

但是,我有数百个变量,并且我不预先知道每个变量使用什么代码。

是否有一个命令可以对所有变量中的所有缺失值执行所需的操作?

1 个答案:

答案 0 :(得分:1)

请考虑以下可复制的玩具示例:

sysuse auto, clear

replace rep78 = .b if rep78 == . & _n < 30
replace rep78 = .f if rep78 == . & _n < 50
replace rep78 = .z if rep78 == . & _n < 70

您可以将recode命令与ds结合使用:

ds, has(type numeric) 
recode `r(varlist)' (missing = .a)