标签: python correlation categorical-data
我有29个特征和大约75万个观测值。 29个特征中有5个是数字特征,最后24个特征是分类特征。我无法使用pd.get_dummies,因为那时我遇到了内存错误(某些功能具有相当多的级别),因此我正在寻找一种方法来计算/可视化变量之间的相关性,而不必使用虚拟变量
pd.get_dummies