编码范围在Stata

时间:2013-01-30 05:49:55

标签: stata

我得到了一个非常粗糙的数据集。一个数据集为我提供了每个X变量(4位数代码)的代码,然后是一个文本文件,解释了每个代码的含义。奇怪的是,代码可能意味着某种东西或范围可能意味着相同的东西。例如:

X
2321
2322
2341
2520
2572
4000
4001
4002
4100

文本文件是这样的:

2300-2372 = New York
2520      = Chicago
2572      = Denver
4000-4099 = Austin
4100-4200 = San Diego

我想要一种简单的方法来编写给定的Stata文件,而无需创建100行代码。因为我有超过1000个分类和大约一百万个观察结果。

1 个答案:

答案 0 :(得分:1)

使用inrange

gen austin = 0
replace austin = 1 if inrange(X, 4000,4099)

对于这里有一个代码的城市,然后让范围在同一点开始和停止