ClusterR - optimal_init方法

时间:2017-09-28 08:25:13

标签: r cluster-analysis

使用ClusterR进行群集的初始化方法的文档非常神秘。您是否可以发布对描述optimal_init方法的论文的引用?

这是正式陈述的内容:

optimal_init:此初始化程序会逐步添加数据行,同时检查它们在质心矩阵中是否已存在

1 个答案:

答案 0 :(得分:0)

ClusterR包的 KMeans_rcpp MiniBatchKmeans 中使用的初始值设定项为:

我在包中添加了最后两个( quantile_init optimal_init ),因为我在各种数据集中测试后发现它们给出了类似(或更好)的结果(使用验证指标)和/或运行得更快。在下一版本的软件包中,它们都是实验性的(你是对的)我将在文档详细信息中添加注释。你可以看到quantile_init的rcpp代码和 程序包存储库中的optimal_init