我有一个名为“categories”的字符串变量,如下所示:
但是,如您所见,一些观察结果列在“类别 1”下,而其他观察结果列在“类别 1”下,但我基本上想将它们加在一起,其中类别 1 的总数为 =(3686 + 36)= 3722.
categories| Freq. Percent Cum.
------------+-----------------------------------
Category 1 | 3,686 10.53 10.53
category 1 | 36 0.10 10.63
category 10 | 54 0.15 10.79
category 11 | 1,122 3.21 13.99
category 2 | 615 1.76 15.75
category 3 | 15,333 43.80 59.55
category 4 | 12,694 36.26 95.81
category 5 | 234 0.67 96.48
category 6 | 110 0.31 96.79
category 7 | 983 2.81 99.60
category 8 | 35 0.10 99.70
category 9 | 105 0.30 100.00
答案 0 :(得分:1)
从这里我猜你的未命名变量是字符串但不是一致分配的。
replace whatever = lower(whatever)
将是将 Category 1
映射到 category 1
的几种方法之一。更好地使用
gen betteryet = real(word(whatever, 2))
由于措辞 category
没有帮助,如果您有类别 1 到 11,您不妨按此顺序查看它们。