如何获得分类数据和连续数据之间的相关性?

时间:2019-05-07 09:37:25

标签: statistics correlation categorical-data continuous pearson-correlation

我想获得非二进制分类数据和连续数据之间的相关系数。 使用scipy,numpy软件包中的stats.pointbiserialr和np.corrcoef获得系数。

1)数据信息。 输入变量(非二进制分类数据,伪变量) 变量“类型”,此数据中总共存在4个类别(类型A,B,C,D)。

输出变量(连续变量)

2)结果(使用np.corrcoef) 变量之间的相关系数。 A型和输出:0.221, B型和输出:-0.688, C型和输出:0.761, 类型D和输出:0.332

所以,我的问题是: 1)您是否了解A型输出比其平均值大0.221? 2)根据类型A和类型B的结果,是否可以假设B是平均值的3倍?

0 个答案:

没有答案