我有以下数据:
id tests testvalue
1 A 4
1 B 5
1 C 3
1 D 3
2 A 3
2 B 3
3 C 3
3 D 4
4 A 3
4 B 5
4 A 1
4 B 3
我想将上述长数据格式更改为以下广泛数据。
id testA testB testC testD index
1 4 5 3 3 1
2 3 3 . . 2
3 . . 3 4 3
4 3 5 . . 4
4 1 3 . . 5
我正在尝试
reshape wide testvalue, i(id) j(tests)
由于tests
中没有唯一值,因此会出错。
这个问题的解决方案是什么?
答案 0 :(得分:2)
您需要创建一个额外的标识符,以使重复可区分。
clear
input id str1 tests testvalue
1 A 4
1 B 5
1 C 3
1 D 3
2 A 3
2 B 3
3 C 3
3 D 4
4 A 3
4 B 5
4 A 1
4 B 3
end
bysort id tests: gen replicate = _n
reshape wide testvalue, i(id replicate) j(tests) string
有关文档,另请参阅here。