以下是我目前存储在Stata中的一个变量complications
下的数据示例:
并发症:1; 1 10; 1 3 10
频率:320; 10; 5
每个数字都与特定的并发症相关,一个人可能有一个或多个并发症。我需要生成10个分类变量来捕获没有/确实有每个并发症的人数。例如,对于并发症1,complication_1 = 0适用于那些没有并发症的人,complication_1 = 1适用于那些患有它的人。对于Stata中的每个并发症,我最有效的方法是什么?
答案 0 :(得分:0)
回应@Nick的评论:发帖时请大力投入。仔细阅读https://stackoverflow.com/help/asking。预计也会进行研究,但您在原始帖子中没有显示。
我的猜测:
clear
set more off
*----- example data -----
input ///
id str12 comp
1 "1"
2 "1 10"
3 "1 3 10"
4 "4"
5 "4 22 10"
end
list
*----- what you want ? -----
// split
split comp, gen(comp)
drop comp
// reshape
reshape long comp, i(id)
drop if missing(comp)
// create indicators
tab comp, gen(comp)
list, sepby(id)
为什么需要这些指标变量是另一回事。较新版本的Stata(起始Stata 11)计入因子变量表示法。如果相关,请参见help factor variables
。