我有5个分类结果变量。我决定放弃不知道答案只保留是/否,这样这些变量就是二进制的。
为了能够进行回归分析,我的想法是构建一个新的结果变量,该变量将具有是/否类别,其中将回答是这些5个变量的答案是答案。我无法弄清楚如何在Stata中执行此操作,命令使用..
答案 0 :(得分:0)
如果您的5个变量都是二元变量且包含0
或1
x1 x2 x3 x4 x5
然后你只需编码
x_any = x1 | x2 | x3 | x4 | x5
如果它们包含yes
或no
,则必须先重新编码为新变量。
gen x1 = (x1_yesno == "yes")
括号不是必需的,但只有当1
为x1_yesno
时,它们才能让您更好地了解Sstata将x1设置为布尔值true(即yes
)。
答案 1 :(得分:0)
您从help egen
获得的前三个功能是相关的。
你似乎想要的是:
egen any_x = anymatch(x1 x2 x3 x4 x5), v(1)
您可能想创建一个复合指标,但是:
egen gx = group(x1 x2 x3 x4 x5), l
这会产生更复杂的结果(只是尝试一下)。 l
选项会标记结果,您将毫不费力地理解它的作用。如果您有兴趣保留NA / DK,group
函数还可以选择缺失值。查看文档,了解最适合您项目的内容。没有进一步的细节或最小的工作实例,很难说。
顺便说一句,上述解决方案也应该有效。