pvclust
非常适合R中的聚类分析。但是,当它作为批处理操作的一部分运行时,获取相同数据的不同结果会很烦人。显然,同一数据有许多“正确”的聚类,似乎pvclust
使用一些随机性来确定特定运行的聚类。但有没有办法获得确定性结果?
我希望能够提供一个最小的,可重复的分析包:数据加上R脚本,以及包含我对聚类的解释的单独书面文档。然后,其他人可以添加到分析中,例如,通过改变地块的美学外观。现在,解释将始终与其他人在运行包含pvclust
的脚本时获得的内容不同步。
答案 0 :(得分:5)
不仅适用于聚类分析,而且当涉及随机性时,您可以修复随机数生成器,以便始终获得相同的结果。
尝试:
set.seed(seed=123)
# your code here
seed
可以是任何整数,或者可以转换为整数的东西。这就是全部。
答案 1 :(得分:1)
我只使用了k种手段。在那里,我必须将“运行”或迭代次数设置为高于默认值的值,以便在连续运行时获得相同的custers。