当存在非唯一列时,如何追加两个数据集?

时间:2018-11-17 16:51:02

标签: stata

我有两个数据集,AB

数据集A具有2000个变量,数据集B具有2500。AB都具有公共变量。

如何附加两个数据集?

在下面您可以找到一个玩具示例:

数据集A:

Name    Age    Sex    Occupation
a        10     M      Engineer

数据集B:

Name    Age    Sex     Children    Income
b        33     F         Y          50

我需要append使得最终数据集如下所示:

Name    Age    Sex    Occupation   Children    Income
a        10     M      Engineer       .          . 
b        33     F          .          Y          50

缺少观测值会生成缺少值。

1 个答案:

答案 0 :(得分:1)

以下对我有用:

clear

input str1 Name Age str1 Sex str10 Occupation
a 10 M Engineer
end

save one, replace

clear

input str1 Name Age str1 Sex str1 Children Income
b 33 F Y 50
end

save two, replace

use one, clear
append using two

list, abbreviate(10)

     +---------------------------------------------------+
     | Name   Age   Sex   Occupation   Children   Income |
     |---------------------------------------------------|
  1. |    a    10     M     Engineer                   . |
  2. |    b    33     F                       Y       50 |
     +---------------------------------------------------+

请注意,Stata仅针对数字变量中的缺失值生成.。对于字符串,将生成一个空格。