我有一个大数据集,其中包含缺少值的变量。缺失值的编码方式不同,例如.b
,.f
等。即使在同一变量内也会发生这种情况。
我正在尝试使用此命令为所有变量提供一个代码:
replace bmi=.a if bmi==.b | bmi==.f
replace age=.a if age==.b | age==.f
但是,我有数百个变量,并且我不预先知道每个变量使用什么代码。
是否有一个命令可以对所有变量中的所有缺失值执行所需的操作?
答案 0 :(得分:1)
请考虑以下可复制的玩具示例:
sysuse auto, clear
replace rep78 = .b if rep78 == . & _n < 30
replace rep78 = .f if rep78 == . & _n < 50
replace rep78 = .z if rep78 == . & _n < 70
您可以将recode
命令与ds
结合使用:
ds, has(type numeric)
recode `r(varlist)' (missing = .a)