标签: python machine-learning
我有分类变量,例如性别,焦虑,酒精,当我使用编码器技术将这些分类变量转换为数值时,所有这些变量的值类似,因此存在多重共线性。我如何将这些变量转换为数字,以便不存在多重共线性。这三个变量对于预测目标变量都很重要。
答案 0 :(得分:1)
您不需要转换数据,而是可以更改计算变量之间相关性的方式。由于这些是分类功能,因此您必须使用Chi-Squared独立性检验,然后,您将不会遇到此问题。