计算连续的

时间:2018-03-02 06:12:32

标签: stata

我有idDD是1或0。

我想为每个id计算“连续一半”。

连续统一计算每个D id中连续1的数量。

id  year    D    CO    
1   1990    1    1          
1   1991    1    2         
1   1992    0    0         
1   1993    0    0         
1   1994    1    1         
1   1995    0    0         
1   1996    1    1         
1   1997    1    2         
2   1990    1    1         
2   1991    0    0         
2   1992    0    0         
2   1993    1    1         
2   1994    1    2
2   1995    1    3

我赚了一笔钱,希望这成为踏脚石。

bysort id (year): gen runningsumD=sum(D)

然后我也尝试了

bysort id (year): replace CO=D[_n-1]+D if D!=0

但这又没有给我我想要的东西。

1 个答案:

答案 0 :(得分:2)

现在,在Statalist和 Stata Journal 中,对Stata中的类似问题进行了大量讨论。知道search的一些关键字会有所帮助,例如您对法术运行的关键字由连续值1定义。

此问题中的咒语开始的条件是感兴趣的值为1 ,前一个值为0 它是小组的开始。 (第二种可能性很容易在编码中忽略。)这种联合条件会给你一个指示变量,在一个咒语开始时为1,否则为O.然后你想要的是在观察同一个法术时提升该指标。

以下是您的数据示例的示例代码和结果:

clear 
input id  year    D    CO    
1   1990    1    1          
1   1991    1    2         
1   1992    0    0         
1   1993    0    0         
1   1994    1    1         
1   1995    0    0         
1   1996    1    1         
1   1997    1    2         
2   1990    1    1         
2   1991    0    0         
2   1992    0    0         
2   1993    1    1         
2   1994    1    2
2   1995    1    3
end 

bysort id (year) : gen wanted = D == 1 & (_n == 1 | D[_n-1] == 0) 
by id: replace wanted = wanted[_n-1] + 1 if D == 1 & wanted == 0 

list, sepby(id) 

     +-----------------------------+
     | id   year   D   CO   wanted |
     |-----------------------------|
  1. |  1   1990   1    1        1 |
  2. |  1   1991   1    2        2 |
  3. |  1   1992   0    0        0 |
  4. |  1   1993   0    0        0 |
  5. |  1   1994   1    1        1 |
  6. |  1   1995   0    0        0 |
  7. |  1   1996   1    1        1 |
  8. |  1   1997   1    2        2 |
     |-----------------------------|
  9. |  2   1990   1    1        1 |
 10. |  2   1991   0    0        0 |
 11. |  2   1992   0    0        0 |
 12. |  2   1993   1    1        1 |
 13. |  2   1994   1    2        2 |
 14. |  2   1995   1    3        3 |
     +-----------------------------+

阅读和节目清单可能包括

SJ-15-1 dm0079  . . . . . . . . . . . . . . .  Stata tip 123: Spell boundaries
        . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  N. J. Cox
        Q1/15   SJ 15(1):319--323                                (no commands)
        shows how to identify spells

SJ-7-2  dm0029  . . . . . . . . . . . . . . Speaking Stata: Identifying spells
        . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  N. J. Cox
        Q2/07   SJ 7(2):249--265                                 (no commands)
        shows how to handle spells with complete control over
        spell specification
最后提到的

.pdf在http://www.stata-journal.com/sjpdf.html?articlenum=dm0029

免费提供 首先提到的

.pdf将在 Stata Journal 18(1)的出版物上免费提供。

tsspell(SSC)是使用刚刚引用的2007年论文中描述的原则的基本工具。 tsspell因此会为您提供搜索Statalist讨论时无法预测的搜索词。

https://www.stata.com/support/faqs/data-management/identifying-runs-of-consecutive-observations/也与相关问题相关。