Question

以下是我目前存储在Stata中的一个变量complications下的数据示例：

并发症：1; 1 10; 1 3 10

频率：320; 10; 5

每个数字都与特定的并发症相关，一个人可能有一个或多个并发症。我需要生成10个分类变量来捕获没有/确实有每个并发症的人数。例如，对于并发症1，complication_1 = 0适用于那些没有并发症的人，complication_1 = 1适用于那些患有它的人。对于Stata中的每个并发症，我最有效的方法是什么？

Answer 1

回应@Nick的评论：发帖时请大力投入。仔细阅读https://stackoverflow.com/help/asking。预计也会进行研究，但您在原始帖子中没有显示。

我的猜测：

clear
set more off

*----- example data -----

input ///
id  str12 comp
1 "1"
2 "1 10"
3 "1 3 10"
4 "4"
5 "4 22 10"
end

list

*----- what you want ? -----

// split
split comp, gen(comp)
drop comp

// reshape
reshape long comp, i(id)
drop if missing(comp)

// create indicators
tab comp, gen(comp)

list, sepby(id)

为什么需要这些指标变量是另一回事。较新版本的Stata（起始Stata 11）计入因子变量表示法。如果相关，请参见help factor variables。

计算Stata中一列数字中出现数字的次数

1 个答案: