在Stata中,有一种快速方法可以显示变量和一堆虚拟变量之间的相关性。在我的数据中,我在游戏中有一个自变量goals_scored
,还有一堆stadium
玩的假人。如何在一个表格中显示goals_scored
和i.stadium
之间的相关性,而不会得到体育场馆之间的相关性,我不关心。
答案 0 :(得分:2)
这是一种方式:
#delimit;
quietly tab stadium, gen(D); // create dummies
foreach var of varlist D* {;
quietly corr goals_scored `var';
di as text "`: variable label `var'': " as result r(rho);
};
drop D*; // get rid of dummies
答案 1 :(得分:1)
cpcorr
(与ssc inst cpcorr
一起安装)支持最小相关表,即只有一组与另一组之间的相关性,而没有其他组。但它是一个旧程序(2001),并不直接支持因子变量。指标变量(a.k.a.虚拟变量)必须首先存在。
答案 2 :(得分:0)
如果您将所有体育场变量存储在本地,您可能会遍历它们以获取相关性。
答案 3 :(得分:0)
1。 如果所有体育场变量在数据集中彼此相邻放置:
foreach s of varlist stadium1-stadium150 {
// do whatever
}
2a上。
如果体育场变量不是彼此相邻,请使用order
到达那里。
2B。 如果变量名称遵循模式,则可能存在另一种解决方法。
3。 我不会为此使用相关性。根据目标的分布情况,我会考虑别的事情。