我正在为英超联赛数据做一个项目。我想我会从一个简单的回归开始(regress finish wins
),在胜利时回归联赛。给出的系数是-.95。我认为这是关闭所以我regress finish
losses
。给出的系数是+.95。显然这不准确,更多的胜利并没有让你在联赛桌上完成更低。我finish
的数据是您的预期,冠军的值为1,最差的球队的值为20。我的胜利数据也合乎逻辑,你拥有的胜利越多,你的价值就越高。更好的球队可能有20胜和更差的球队8.这些是他们给出的价值观。
我认为Stata的意图有所改变。是否认为Wins的更高价值是坏的?我认为它认为我按赢得的总比赛排名,而不是赢得的实际比赛数。我该如何解决这个问题?
答案 0 :(得分:1)
由于联赛结束位置的标记方式,系数显示为负数。
因为最佳位置,即第一名,被计为1,较低的位置给出增加的值(2,3 ......),更高/更好的联赛位置实际上与较低的值相关联。
因此,拥有更多胜利的球队预计将获得联赛位置的较低值。
因此,胜利数量和联赛位置的相关性预计为负值。
要解决这个问题,您可以:
X=21-F
,如果有20支球队且联赛位置为F
。