与一个变量和许多其他变量的相关性

时间:2013-02-03 18:39:46

标签: stata

在Stata中,有一种快速方法可以显示变量和一堆虚拟变量之间的相关性。在我的数据中,我在游戏中有一个自变量goals_scored,还有一堆stadium玩的假人。如何在一个表格中显示goals_scoredi.stadium之间的相关性,而不会得到体育场馆之间的相关性,我不关心。

4 个答案:

答案 0 :(得分:2)

这是一种方式:

#delimit;    

quietly tab stadium, gen(D); // create dummies

foreach var of varlist D* {;    
  quietly corr goals_scored `var';
  di as text "`: variable label `var'':   " as result r(rho);
};

drop D*; // get rid of dummies

答案 1 :(得分:1)

来自SSC的

cpcorr(与ssc inst cpcorr一起安装)支持最小相关表,即只有一组与另一组之间的相关性,而没有其他组。但它是一个旧程序(2001),并不直接支持因子变量。指标变量(a.k.a.虚拟变量)必须首先存在。

答案 2 :(得分:0)

如果您将所有体育场变量存储在本地,您可能会遍历它们以获取相关性。

答案 3 :(得分:0)

1。 如果所有体育场变量在数据集中彼此相邻放置:

foreach s of varlist stadium1-stadium150 {
    // do whatever
}

2a上。 如果体育场变量不是彼此相邻,请使用order到达那里。

2B。 如果变量名称遵循模式,则可能存在另一种解决方法。

3。 我不会为此使用相关性。根据目标的分布情况,我会考虑别的事情。