我正在尝试使用一个数据集,该数据集将国家/地区和年份不合理地合并为国家/地区变量。例如,对于2006年的美国,国家变量中的相应观察将是US2006。
有没有办法可以将两者分开并生成两个新变量,一个只有国名,另一个只有一年?
答案 0 :(得分:1)
正如@Roberto Ferrer评论的那样,如果字符串变量的值类似于“US2006”,则可以继续
gen year = real(substr(whatever, -4, 4))
gen country = substr(whatever, 1, length(whatever) - 4)
第一个语句提取最后4个字符并将它们转换为数字。第二个语句从原始变量的副本中删除最后4个字符,并将其余字符放在一个新变量中。