从Stata中给定的5个分类变量构造新变量

时间:2013-04-14 14:18:17

标签: categorical-data stata

我有5个分类结果变量。我决定放弃不知道答案只保留是/否,这样这些变量就是二进制的。

为了能够进行回归分析,我的想法是构建一个新的结果变量,该变量将具有是/否类别,其中将回答是这些5个变量的答案是答案。我无法弄清楚如何在Stata中执行此操作,命令使用..

2 个答案:

答案 0 :(得分:0)

如果您的5个变量都是二元变量且包含01

x1 x2 x3 x4 x5

然后你只需编码

x_any = x1 | x2 | x3 | x4 | x5

如果它们包含yesno,则必须先重新编码为新变量。

gen x1 = (x1_yesno == "yes")

括号不是必需的,但只有当1x1_yesno时,它们才能让您更好地了解Sstata将x1设置为布尔值true(即yes)。

答案 1 :(得分:0)

您从help egen获得的前三个功能是相关的。

你似乎想要的是:

egen any_x = anymatch(x1 x2 x3 x4 x5), v(1)

您可能想创建一个复合指标,但是:

egen gx = group(x1 x2 x3 x4 x5), l

这会产生更复杂的结果(只是尝试一下)。 l选项会标记结果,您将毫不费力地理解它的作用。如果您有兴趣保留NA / DK,group函数还可以选择缺失值。查看文档,了解最适合您项目的内容。没有进一步的细节或最小的工作实例,很难说。

顺便说一句,上述解决方案也应该有效。