将同一分类变量下的两组相加

时间:2020-12-18 19:47:45

标签: stata data-manipulation

我有一个名为“categories”的字符串变量,如下所示:

但是,如您所见,一些观察结果列在“类别 1”下,而其他观察结果列在“类别 1”下,但我基本上想将它们加在一起,其中类别 1 的总数为 =(3686 + 36)= 3722.

categories|      Freq.     Percent        Cum.
------------+-----------------------------------
 Category 1 |      3,686       10.53       10.53
 category 1 |         36        0.10       10.63
category 10 |         54        0.15       10.79
category 11 |      1,122        3.21       13.99
 category 2 |        615        1.76       15.75
 category 3 |     15,333       43.80       59.55
 category 4 |     12,694       36.26       95.81
 category 5 |        234        0.67       96.48
 category 6 |        110        0.31       96.79
 category 7 |        983        2.81       99.60
 category 8 |         35        0.10       99.70
 category 9 |        105        0.30      100.00

1 个答案:

答案 0 :(得分:1)

从这里我猜你的未命名变量是字符串但不是一致分配的。

replace whatever = lower(whatever) 

将是将 Category 1 映射到 category 1 的几种方法之一。更好地使用

gen betteryet = real(word(whatever, 2)) 

由于措辞 category 没有帮助,如果您有类别 1 到 11,您不妨按此顺序查看它们。