Question

pvclust非常适合R中的聚类分析。但是，当它作为批处理操作的一部分运行时，获取相同数据的不同结果会很烦人。显然，同一数据有许多“正确”的聚类，似乎pvclust使用一些随机性来确定特定运行的聚类。但有没有办法获得确定性结果？

我希望能够提供一个最小的，可重复的分析包：数据加上R脚本，以及包含我对聚类的解释的单独书面文档。然后，其他人可以添加到分析中，例如，通过改变地块的美学外观。现在，解释将始终与其他人在运行包含pvclust的脚本时获得的内容不同步。

Answer 1

不仅适用于聚类分析，而且当涉及随机性时，您可以修复随机数生成器，以便始终获得相同的结果。

尝试：

set.seed(seed=123)
# your code here

seed可以是任何整数，或者可以转换为整数的东西。这就是全部。

Answer 2

我只使用了k种手段。在那里，我必须将“运行”或迭代次数设置为高于默认值的值，以便在连续运行时获得相同的custers。