我目前正在为国际足球经理的胜率滚动平均值做一些工作,因为我打算在未来的某些持续时间建模中使用它。我只是不确定如何在Stata中产生这种滚动平均值,以考虑到胜利,平局或亏损的假人以及当经理离开他们的工作时。我还制作了一个“结果变量”,仅作为捕获这三种结果的类别变量。
例如,对于我的数据集中的前3个观察结果,我有第一个赢得前两场比赛并且输掉第三个比赛的经理;在此之后,他离开了他的位置。因此,在第一次和第二次观察中,他将获得100%的胜率,然后是第三次观察的66.6%。然后胜利百分比必须为新经理重置。如果这有帮助,我分别编写了管理员ID。我只是想知道如何正确编码这种滚动平均值而不是每次都使用计算器?
答案 0 :(得分:0)
假设你有这样的数据,输赢或失败:
win manager_id game_num
1 1 1
1 1 2
0 1 3
1 2 1
1 2 2
1 2 3
0 3 1
0 3 2
1 3 3
您可以使用以下内容:
bysort manager_id (game_num): gen pct = sum(win)
replace pct = 100*pct/game_num