我有id
和D
。 D
是1或0。
我想为每个id
计算“连续一半”。
连续统一计算每个D
id
中连续1的数量。
id year D CO
1 1990 1 1
1 1991 1 2
1 1992 0 0
1 1993 0 0
1 1994 1 1
1 1995 0 0
1 1996 1 1
1 1997 1 2
2 1990 1 1
2 1991 0 0
2 1992 0 0
2 1993 1 1
2 1994 1 2
2 1995 1 3
我赚了一笔钱,希望这成为踏脚石。
bysort id (year): gen runningsumD=sum(D)
然后我也尝试了
bysort id (year): replace CO=D[_n-1]+D if D!=0
但这又没有给我我想要的东西。
答案 0 :(得分:2)
现在,在Statalist和 Stata Journal 中,对Stata中的类似问题进行了大量讨论。知道search
的一些关键字会有所帮助,例如您对法术或运行的关键字由连续值1定义。
此问题中的咒语开始的条件是感兴趣的值为1 且,前一个值为0 或它是小组的开始。 (第二种可能性很容易在编码中忽略。)这种联合条件会给你一个指示变量,在一个咒语开始时为1,否则为O.然后你想要的是在观察同一个法术时提升该指标。
以下是您的数据示例的示例代码和结果:
clear
input id year D CO
1 1990 1 1
1 1991 1 2
1 1992 0 0
1 1993 0 0
1 1994 1 1
1 1995 0 0
1 1996 1 1
1 1997 1 2
2 1990 1 1
2 1991 0 0
2 1992 0 0
2 1993 1 1
2 1994 1 2
2 1995 1 3
end
bysort id (year) : gen wanted = D == 1 & (_n == 1 | D[_n-1] == 0)
by id: replace wanted = wanted[_n-1] + 1 if D == 1 & wanted == 0
list, sepby(id)
+-----------------------------+
| id year D CO wanted |
|-----------------------------|
1. | 1 1990 1 1 1 |
2. | 1 1991 1 2 2 |
3. | 1 1992 0 0 0 |
4. | 1 1993 0 0 0 |
5. | 1 1994 1 1 1 |
6. | 1 1995 0 0 0 |
7. | 1 1996 1 1 1 |
8. | 1 1997 1 2 2 |
|-----------------------------|
9. | 2 1990 1 1 1 |
10. | 2 1991 0 0 0 |
11. | 2 1992 0 0 0 |
12. | 2 1993 1 1 1 |
13. | 2 1994 1 2 2 |
14. | 2 1995 1 3 3 |
+-----------------------------+
阅读和节目清单可能包括
SJ-15-1 dm0079 . . . . . . . . . . . . . . . Stata tip 123: Spell boundaries
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . N. J. Cox
Q1/15 SJ 15(1):319--323 (no commands)
shows how to identify spells
SJ-7-2 dm0029 . . . . . . . . . . . . . . Speaking Stata: Identifying spells
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . N. J. Cox
Q2/07 SJ 7(2):249--265 (no commands)
shows how to handle spells with complete control over
spell specification
最后提到的.pdf在http://www.stata-journal.com/sjpdf.html?articlenum=dm0029
免费提供 首先提到的.pdf将在 Stata Journal 18(1)的出版物上免费提供。
tsspell
(SSC)是使用刚刚引用的2007年论文中描述的原则的基本工具。 tsspell
因此会为您提供搜索Statalist讨论时无法预测的搜索词。
https://www.stata.com/support/faqs/data-management/identifying-runs-of-consecutive-observations/也与相关问题相关。