我有一个像这样的Stata数据集:
HouseholdId PersonId OtherVariables
1 1
1 2
2 1
2 2
3 1
3 2
此处HouseholdId
是每个家庭的唯一标识符,PersonId
是家庭中每个人的唯一标识符。如果我想为样本中的每个人创建一个唯一的个人ID,期限。我该怎么做?
我试过egen per_id = group(PersonID HouseholdID)
但这似乎不起作用。
答案 0 :(得分:1)
我认为您需要整个数据集中每个人的唯一标识符。那可能只是
sort HouseholdId PersonId
gen long obs Id = _n
如下可访问的讨论in this Stata FAQ。这可以通过键入Stata
找到search identifier
甚至
search id
(元回答:您可以而且应该在Stata中查看有关此类基本概念的信息。)
我强烈建议单词 unique 仍然只能出现一次。我建议,单词 distinct 是一个更好的词,这就是你的意思。更多关于this paper的第588页的内容。