解释R Mclust包的结果

时间:2014-03-10 06:37:53

标签: r cluster-analysis

我正在使用R包mclust估算数据中的簇数并获得此结果:

Clustering table:
     2      7      8      9 
205693   4465   2418     91 
Warning messages:
1: In map(z) : no assignment to 1,3,4,5,6
2: In map(z) : no assignment to 1,3,4,5,6

我有9个群集是最好的,但它没有分配给5个群集。 那么这是否意味着我想使用9或5个集群?

如果可以在网上某处找到答案,我们将非常感谢链接。提前谢谢。

1 个答案:

答案 0 :(得分:2)

最有可能的是,该方法对您的数据根本不起作用......

您可以尝试其他种子,因为当您“失去”群集(即它们变空)时,这通常意味着您的种子选择不够好。而你的集群9也几乎消失了。

然而,如果您的数据实际上是由高斯混合物生成的,那么很难找到这么糟糕的起点...所以很可能,所有结果都很糟糕,因为数据不符合您的假设。 / p>

从您的群集大小来看,我会说你有 1群集和很多噪音 ......

您是否已对结果进行了可视化和验证?

不要盲目跟随一些号码。验证