集群质量措施

时间:2012-04-28 16:58:01

标签: matlab cluster-analysis data-mining evaluation

Matlab是否提供评估聚类方法的任何工具? (集群紧凑性和集群分离......) 或者它有任何工具箱吗?

4 个答案:

答案 0 :(得分:5)

Matlab提供了Silhouette索引,Matlab有一个工具箱CVAP: Cluster Validity Analysis Platform。其中包括以下有效性指标:

  • 戴维斯-尔丁
  • Calinski-Harabasz
  • 邓恩指数
  • R平方指数
  • Hubert-Levin(C-index)
  • Krzanowski-Lai指数
  • Hartigan指数
  • 均方根标准差(RMSSTD)指数
  • 半部分R平方(SPR)指数
  • 两个群集(CD)索引之间的距离
  • 加权内部间索引
  • 同质性指数
  • 分离指数

请注意,您的平台可能需要预编译LIBRA binaries

答案 1 :(得分:4)

您可以从统计工具箱中尝试Silhouette plot

有关示例,请参阅this documentation

答案 2 :(得分:4)

不在Matlab中,但是ELKI(Java)提供了十几个集群质量度量标准用于评估。

答案 3 :(得分:3)

请注意,Matlab中的Silhouette对单例群集有一些奇怪的行为。它为单身人士分配1分,对我而言,更合理的方法是为这些集群提供0分。在Matlab实现中,如果您将群集数量作为对象数量,则Silhouette会给您1分。