单独变量的country和year元素

时间:2015-02-10 15:35:30

标签: statistics stata

我正在尝试使用一个数据集,该数据集将国家/地区和年份不合理地合并为国家/地区变量。例如,对于2006年的美国,国家变量中的相应观察将是US2006。

有没有办法可以将两者分开并生成两个新变量,一个只有国名,另一个只有一年?

1 个答案:

答案 0 :(得分:1)

正如@Roberto Ferrer评论的那样,如果字符串变量的值类似于“US2006”,则可以继续

 gen year = real(substr(whatever, -4, 4))
 gen country = substr(whatever, 1, length(whatever) - 4) 

第一个语句提取最后4个字符并将它们转换为数字。第二个语句从原始变量的副本中删除最后4个字符,并将其余字符放在一个新变量中。