我在Stata中具有以下数据集:
* Example generated by -dataex-. To install: ssc install dataex
clear
input id price weight length str3(origin destination)
1 2763 . 34 "AUS" "USA"
2 . 234 28 "" "GER"
1 2763 543 . "." "USA"
2 8976 . 28 "ESP" "GER"
3 . 112 . "ARG" "POL"
3 1256 112 . "ARG" "POL"
3 1256 112 66 "." "."
4 6789 . 16 "UK" ""
2 8976 . . "ESP" ""
4 . 452 16 "." "CAN"
end
其中包含不同行中不同条目的不同数据。
如何将所有内容合并到单个条目中,以获取以下输出:
1 2763 543 34 "AUS" "USA"
2 8976 234 28 "ESP" "GER"
3 1256 112 66 "ARG" "POL"
4 6789 452 16 "UK" "CAN"
答案 0 :(得分:-1)
我的解决方案分两个步骤:
根据id或price或缺少很少值的任何值生成多个组变量。例如,根据id生成一个group_1变量。根据此变量对所有数据进行排序和排名。
使用xfill命令填充组中的缺失值。
您需要重复这两个步骤,并根据确切的数据集使用由不同的基础变量构造的不同的id变量。