记忆效率计算距离矩阵的方法

时间:2016-06-27 23:05:56

标签: r data.table

我希望使用data.table计算距离矩阵,以便我可以在其上执行分层聚类算法(hclust)。

我拥有的物品数量大约为100k,导致我内存不足,每个都有x轴值和y轴值(东向和北向),因此可以计算每个项目之间的欧几里德距离。与先前问题(Calculate Euclidean distance matrix using a big.matrix object)的主要区别在于,它有两个构成特定项目的元素,即x和y元素不是标准单个元素。

下面是我尝试使用data.table尝试的可重现的示例,但遇到了尝试分配太大的向量的问题,因此想知道是否有更多内存有效的方法来执行此操作。

也许使用Rcppbigmemory的{​​{1}}功能?但是big.matrix甚至可以在hclust对象上工作吗?

任何帮助都会非常感激。

big.matrix

0 个答案:

没有答案