在Matlab中使用多个指标进行聚类

时间:2014-05-23 00:51:01

标签: matlab cluster-analysis hierarchical-clustering categorical-data

我有一个数据集,其中包含每行的分类和数字功能。我想为每个特征(列)选择不同的相似性度量,并对数据进行层次化聚类。有没有办法在Matlab中做到这一点?

1 个答案:

答案 0 :(得分:0)

是的,这实际上相当简单:创建树的linkage将不相似矩阵作为输入。因此,在下面的示例工作流程中

Y = pdist(X,'cityblock');
Z = linkage(Y,'average');
T = cluster(Z,'cutoff')

您只需将对pdist的调用替换为您自己的函数调用,该函数计算行之间的成对不相似性,其他所有内容都保持不变。