在R中管理大矩阵

时间:2013-07-02 20:16:29

标签: r memory matrix storage

R - 我有一个双精度矩阵62589x62589,当我将矩阵保存到Rdata对象时,它是28GB,这是一个疯狂的大小还是相对正常的,有什么方法吗?

2 个答案:

答案 0 :(得分:3)

如果它是一个密集的矩阵,那么你无能为力。该矩阵的存储要求大致为

  

6 * 6 * 10 ^ 4 * 10 ^ 4 * 8字节= 288 * 10 ^ 8字节= 28.8千兆字节。

8个字节是double的大小。您可以使用single值,这个大小减半。

对于sparse matrices,Douglas Bates和Martin Maechler的Matrix套餐是你的朋友。

答案 1 :(得分:1)

我会确保您已经研究了专门为微阵列数据设计的R包。例如,Bioconductor具有微阵列包(http://www.bioconductor.org/help/workflows/arrays/)。但肯定还有其他人。如果它们被设计为使用类似的大型数据集,则这些包可能已经解决了该问题。