应用错误收集

我一直在观看有关群集的教程。我理解像虹膜等小数据集上的概念。我遇到的问题是尝试使用20个不相关的特征来聚类数据集。例如，当这些特征中的5个或6个以二进制表示，其余是数字特征时，我该如何处理这种情况？假设特征1为1200，特征2为10，特征3为1，特征4为1等。诸如k-means之类的算法如何在该场景中工作？它是否将所有特征1聚集在一起，将特征2聚集在一起等等。或者它是否将所有二进制特征聚集在一起？

具有多个不相关特征的聚类算法

0 个答案: