R中的聚类分析:如何从pvclust获得确定性结果?

时间:2014-01-02 05:43:02

标签: r random cluster-analysis hierarchical-clustering pvclust

pvclust非常适合R中的聚类分析。但是,当它作为批处理操作的一部分运行时,获取相同数据的不同结果会很烦人。显然,同一数据有许多“正确”的聚类,似乎pvclust使用一些随机性来确定特定运行的聚类。但有没有办法获得确定性结果?

我希望能够提供一个最小的,可重复的分析包:数据加上R脚本,以及包含我对聚类的解释的单独书面文档。然后,其他人可以添加到分析中,例如,通过改变地块的美学外观。现在,解释将始终与其他人在运行包含pvclust的脚本时获得的内容不同步。

2 个答案:

答案 0 :(得分:5)

不仅适用于聚类分析,而且当涉及随机性时,您可以修复随机数生成器,以便始终获得相同的结果。

尝试:

set.seed(seed=123)
# your code here

seed可以是任何整数,或者可以转换为整数的东西。这就是全部。

答案 1 :(得分:1)

我只使用了k种手段。在那里,我必须将“运行”或迭代次数设置为高于默认值的值,以便在连续运行时获得相同的custers。