在R中,我正在尝试使用大型矩阵(39,146,166行乘127列),并且我遇到了许多操作的内存问题。我已经确定矩阵中大约35%的条目是非零的,其余的都是零。这是否足够稀疏,我会使用R的稀疏矩阵类之一来保存表示此矩阵的内存?确定矩阵何时值得稀疏地表示什么是一个很好的经验法则?
答案 0 :(得分:2)
我不认为稀疏表示会更加紧凑。除了隐式零之外,每个数字项需要三个数字。因此,即使其中两个是4字节整数,内存中的空间仍将大于" serial"存储策略。
通过这种推理,任何超过50%的内容都会占用更多的存储空间,但我会在SF Bay下的iPhone上发帖,因此无法使用' object.size'进行测试。