clValid函数适用于大数据

时间:2014-05-19 12:30:57

标签: r bigdata hierarchical-clustering

clValid报告群集结果的验证度量。该函数返回类clValid的对象,除了验证度量之外,还包含聚类结果。验证措施分为三大类:internalstabilitybiological

 clValid(obj, nClust, clMethods="hierarchical", validation="stability", maxitems=600, 
         metric="euclidean", method="average", neighbSize=10, ...)

知道如何调整上述函数以使其适用于大数据(即maxitems >= 50000)吗?

1 个答案:

答案 0 :(得分:0)

我不清楚你理解“调整”的含义。也许你必须兼顾这个功能。顺便说一句,您可以设置参数maxitems=nrow(obj),但它确实很慢。

更新: 这是一个paralled clValid