标签: machine-learning k-means dbscan
我一直在观看有关群集的教程。我理解像虹膜等小数据集上的概念。我遇到的问题是尝试使用20个不相关的特征来聚类数据集。例如,当这些特征中的5个或6个以二进制表示,其余是数字特征时,我该如何处理这种情况?假设特征1为1200,特征2为10,特征3为1,特征4为1等。诸如k-means之类的算法如何在该场景中工作?它是否将所有特征1聚集在一起,将特征2聚集在一起等等。或者它是否将所有二进制特征聚集在一起?