标签: python chi-squared
我有42个分类变量,它们的编码范围是(0,1,2,3,4,5,6,7,8)(不是每个变量都有n个因子)。我想使用在python中使用import scipy.stats的卡方检验来测试它们之间的依赖性。但是根据文档,我发现将分类变量转换为虚拟变量比计算卡方值更合适。
是否有任何方法可以将这些分类变量转换为python中的虚拟变量,从0、1、2、3、4、5、6等等转换为虚拟变量?
然后为所有变量计算卡方矩阵以选择最重要的变量??