应用错误收集

有没有办法在R中分批进行凝聚聚类？

时间：2017-08-22 23:41:44

标签： r cluster-analysis scalability

我有几组数据，行数最多为24,000。我手动计算了点之间的成对距离，其中距离基于自定义文本匹配规则。

我已经能够在大小为1000的组上使用hclust执行凝聚聚类，但我的系统资源无法处理24K x 24K / 2比较所需的较大的群体。

距离的表示占用O [n ^ 2]空间，但聚类表示应该只占用O（n * ln（n））空间。 R中是否有任何可以批量执行凝聚聚类的软件包？

0 个答案:

没有答案