我希望使用data.table
计算距离矩阵,以便我可以在其上执行分层聚类算法(hclust
)。
我拥有的物品数量大约为100k,导致我内存不足,每个都有x轴值和y轴值(东向和北向),因此可以计算每个项目之间的欧几里德距离。与先前问题(Calculate Euclidean distance matrix using a big.matrix object)的主要区别在于,它有两个构成特定项目的元素,即x和y元素不是标准单个元素。
下面是我尝试使用data.table
尝试的可重现的示例,但遇到了尝试分配太大的向量的问题,因此想知道是否有更多内存有效的方法来执行此操作。
也许使用Rcpp
或bigmemory
的{{1}}功能?但是big.matrix
甚至可以在hclust
对象上工作吗?
任何帮助都会非常感激。
big.matrix