无监督学习中的标签编码

时间:2018-07-20 15:03:02

标签: machine-learning preprocessor unsupervised-learning

让我们假设我的数据是混合的,并且由连续特征和离散分类特征组成。此外,无法对分类特征进行排名。

在这种情况下标签编码是否有意义?如果可以,可以在该标签上应用哪种聚类算法?

据我了解,大多数聚类算法都使用诸如欧几里得距离之类的指标,这些指标试图通过测量输入与质心,神经元之间的距离来测量相似性和差异。 标签编码将分类特征转换为数值,例如[猫,狗,鸟]的数值增加,如[0,1,2] 因此,如果不打算对欧几里德距离之类的指标进行排名,就无法使用这些值,对吗?在这种情况下,什么样的聚类算法可以与标签编码一起用于后处理中?

直到现在,我对数据进行一次热编码,并使用了自组织图,这给了我很好的结果,但是我对进一步的改进感兴趣。

0 个答案:

没有答案
相关问题