计算Stata中一列数字中出现数字的次数

时间:2015-04-10 23:00:29

标签: stata

以下是我目前存储在Stata中的一个变量complications下的数据示例:

并发症:1; 1 10; 1 3 10

频率:320; 10; 5

每个数字都与特定的并发症相关,一个人可能有一个或多个并发症。我需要生成10个分类变量来捕获没有/确实有每个并发症的人数。例如,对于并发症1,complication_1 = 0适用于那些没有并发症的人,complication_1 = 1适用于那些患有它的人。对于Stata中的每个并发症,我最有效的方法是什么?

1 个答案:

答案 0 :(得分:0)

回应@Nick的评论:发帖时请大力投入。仔细阅读https://stackoverflow.com/help/asking。预计也会进行研究,但您在原始帖子中没有显示。

我的猜测:

clear
set more off

*----- example data -----

input ///
id  str12 comp
1 "1"
2 "1 10"
3 "1 3 10"
4 "4"
5 "4 22 10"
end

list

*----- what you want ? -----

// split
split comp, gen(comp)
drop comp

// reshape
reshape long comp, i(id)
drop if missing(comp)

// create indicators
tab comp, gen(comp)

list, sepby(id)

为什么需要这些指标变量是另一回事。较新版本的Stata(起始Stata 11)计入因子变量表示法。如果相关,请参见help factor variables