线性回归系数与预期和错误完全相反。单位增加胜利导致联赛结束时减少.95单位?

时间:2017-02-21 21:45:18

标签: regression stata coefficients

我正在为英超联赛数据做一个项目。我想我会从一个简单的回归开始(regress finish wins),在胜利时回归联赛。给出的系数是-.95。我认为这是关闭所以我regress finish losses。给出的系数是+.95。显然这不准确,更多的胜利并没有让你在联赛桌上完成更低。我finish的数据是您的预期,冠军的值为1,最差的球队的值为20。我的胜利数据也合乎逻辑,你拥有的胜利越多,你的价值就越高。更好的球队可能有20胜和更差的球队8.这些是他们给出的价值观。

我认为Stata的意图有所改变。是否认为Wins的更高价值是坏的?我认为它认为我按赢得的总比赛排名,而不是赢得的实际比赛数。我该如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

由于联赛结束位置的标记方式,系数显示为负数。

因为最佳位置,即第一名,被计为1,较低的位置给出增加的值(2,3 ......),更高/更好的联赛位置实际上与较低的值相关联。

因此,拥有更多胜利的球队预计将获得联赛位置的较低值。

因此,胜利数量和联赛位置的相关性预计为负值。

要解决这个问题,您可以:

  • 为完成位置创建一个新变量,该变量按顺序排列,以便更好的联赛位置对应更高的值。最简单的方法是X=21-F,如果有20支球队且联赛位置为F
  • 接受相关性为负,但请务必在以后正确解释。