使用ClusterR进行群集的初始化方法的文档非常神秘。您是否可以发布对描述optimal_init方法的论文的引用?
这是正式陈述的内容:
optimal_init:此初始化程序会逐步添加数据行,同时检查它们在质心矩阵中是否已存在
答案 0 :(得分:0)
ClusterR包的 KMeans_rcpp 和 MiniBatchKmeans 中使用的初始值设定项为:
我在包中添加了最后两个( quantile_init 和 optimal_init ),因为我在各种数据集中测试后发现它们给出了类似(或更好)的结果(使用验证指标)和/或运行得更快。在下一版本的软件包中,它们都是实验性的(你是对的)我将在文档详细信息中添加注释。你可以看到quantile_init的rcpp代码和 程序包存储库中的optimal_init。