标签: python-3.x machine-learning statistics feature-selection unsupervised-learning
在从最近邻居问题开始之前,我需要从数据框中选择最重要的功能。
哪种方法最好做到这一点?我的数据框具有大约8个分类特征和2个连续特征,但没有目标变量。 问题是我具有三个分类特征,它们只能是一种热编码,一旦这样做,它将数据分解为47个OHE变量。
那么考虑到这些情况,什么是进行特征选择的最佳方法?