我想获得非二进制分类数据和连续数据之间的相关系数。 使用scipy,numpy软件包中的stats.pointbiserialr和np.corrcoef获得系数。
1)数据信息。 输入变量(非二进制分类数据,伪变量) 变量“类型”,此数据中总共存在4个类别(类型A,B,C,D)。
输出变量(连续变量)
2)结果(使用np.corrcoef) 变量之间的相关系数。 A型和输出:0.221, B型和输出:-0.688, C型和输出:0.761, 类型D和输出:0.332
所以,我的问题是: 1)您是否了解A型输出比其平均值大0.221? 2)根据类型A和类型B的结果,是否可以假设B是平均值的3倍?