标签: pandas statistics correlation
有人可以告诉是否正确,以便在具有correlation的因变量和使用熊猫binary class(0 or 1)具有连续值的自变量之间找到df.corr()。
correlation
binary class(0 or 1)
df.corr()
如果我使用相关输出,我会得到相关输出。但是我想了解在二进制分类输出和连续输入变量之间找到皮尔逊相关性(使用df.corr())在统计上是否正确。
答案 0 :(得分:0)
如果一个是分类的而另一个是二进制的,则pearson相关用于连续数据,您应该使用ANOVA来查看变量refrence之间的关系