machine-learning - 无监督学习中的标签编码

让我们假设我的数据是混合的，并且由连续特征和离散分类特征组成。此外，无法对分类特征进行排名。

在这种情况下标签编码是否有意义？如果可以，可以在该标签上应用哪种聚类算法？

据我了解，大多数聚类算法都使用诸如欧几里得距离之类的指标，这些指标试图通过测量输入与质心，神经元之间的距离来测量相似性和差异。标签编码将分类特征转换为数值，例如[猫，狗，鸟]的数值增加，如[0，1，2] 因此，如果不打算对欧几里德距离之类的指标进行排名，就无法使用这些值，对吗？在这种情况下，什么样的聚类算法可以与标签编码一起用于后处理中？

直到现在，我对数据进行一次热编码，并使用了自组织图，这给了我很好的结果，但是我对进一步的改进感兴趣。

无监督学习中的标签编码

0 个答案: