我的数据包含三种不同类型的缺失值,"通常"一个.
和扩展缺失值.a
和.b
。
当我使用数字问卷时,系统.
对我来说并不感兴趣,因为它们意味着受访者只是没有达到这个问题(对于过滤的问题)。
扩展缺失值.a .b
是"真实"缺失值(没有回答/不知道)。
我想提供一个表格,显示每种类型的缺失值的数量,例如
Variable | (.) | .a | .b
__________________________________________________
Income | 9 | 15 | 2
关于如何创建这样的表的任何想法?我现在查看了Stata中的不同命令tabmiss
,missings
,missing sum
,但目前没有明确答案。
答案 0 :(得分:1)
以下是一个可能为您提供有用指导的示例。
clear
input x y z
1 1 1
. . .
3 .a .b
.b 4 .a
.a .a 5
end
list, clean
gen seqno = _n
rename (x y z) (vbl=)
reshape long vbl, i(seqno) j(variable) string
list, clean
rename vbl value
drop if !missing(value)
tab variable value, missing
| value
variable | . .a .b | Total
-----------+---------------------------------+----------
x | 1 1 1 | 3
y | 1 2 0 | 3
z | 1 1 1 | 3
-----------+---------------------------------+----------
Total | 3 4 2 | 9