在Stata与自我合并

时间:2013-05-27 02:55:15

标签: statistics stata

我有两组A和B的数据,如下所示:

group  key   val
A      0.00  1.23
A      0.25  2.31
A      0.50  3.10
A      0.75  4.21
A      1.00  2.51
A      0.00  1.43
B      0.25  1.31
B      0.50  5.10
B      0.75  2.21
B      1.00  8.51

我想要第四列,将其称为Bval,如下所示:

  • 对于B组中的所有观察值,应该缺少值
  • 对于A组中的所有观察值,该值应对应于B组中共享相同键的观察值的val

我敢肯定这不会太难,但我是Stata的新手,现在谷歌搜索了一个小时,似乎无法弄明白。

2 个答案:

答案 0 :(得分:2)

这样的事情怎么样?

clear  
input str1 group key val  
A 0.00 1.23  
A 0.25 2.31  
A 0.50 3.10  
A 0.75 4.21  
A 1.00 2.51  
A 0.00 1.43  
B 0.25 1.31  
B 0.50 5.10  
B 0.75 2.21  
B 1.00 8.51  
end  

preserve  

keep if group == "B"  
rename val Bval  
tempfile b  
save `b'  

restore  

merge m:1 key using `b', nogenerate keep(1 3)  
replace Bval = . if group == "B"  

答案 1 :(得分:2)

这也适用于您的示例。

 . clear 

 . input str1 group  key   val

             group        key        val
 1. A      0.00  1.23
 2. A      0.25  2.31
 3. A      0.50  3.10
 4. A      0.75  4.21
 5. A      1.00  2.51
 6. A      0.00  1.43
 7. B      0.25  1.31
 8. B      0.50  5.10
 9. B      0.75  2.21
10. B      1.00  8.51
11. end 

. sort key group

. gen Bval = val[_n+1] if group == "A" & group[_n+1] == "B" & key == key[_n+1] 
(6 missing values generated)

. l

      +---------------------------+
      | group   key    val   Bval |
      |---------------------------|
   1. |     A     0   1.23      . |
   2. |     A     0   1.43      . |
   3. |     A   .25   2.31   1.31 |
   4. |     B   .25   1.31      . |
   5. |     A    .5    3.1    5.1 |
      |---------------------------|
   6. |     B    .5    5.1      . |
   7. |     A   .75   4.21   2.21 |
   8. |     B   .75   2.21      . |
   9. |     A     1   2.51   8.51 |
  10. |     B     1   8.51      . |
      +---------------------------+