> length(row)
[1] 1000
> object.size(row)
8024 bytes
> object.size(row[1])
32 bytes
这里的行是一个列表。 行的长度为1000,其元素之一为32字节。因此,列表的总大小应该是32 * 1000字节,但由于某种原因它的8024。这可能是什么原因?
答案 0 :(得分:5)
初始开销:
> row = runif(1000)
> object.size(row[1])
32 bytes
> object.size(row[1:2])
40 bytes
> object.size(row[1:3])
56 bytes
> object.size(row[1:4])
56 bytes
长度为1的向量为32个字节,另外每个元素为8个字节。还有一些其他分配功能在低端进行,有时会占用16个字节,但平均为8个字节。
开始时的额外字节是因为R必须将长度和其他属性保留在某处。
require(plyr)
size = ldply(1:200,function(i){object.size(row[1:i])})$V1
plot(1:200,size,type="l")
答案 1 :(得分:3)
这是一个长度为1000的列表
> lst = vector("list", 1000)
> object.size(lst)
8040 bytes
它由列表list()
,列表lst[[1]]
的元素和指向每个列表元素的指针组成。
> object.size(list())
40 bytes
> object.size(row[[1]])
0 bytes
> object.size(lst[1]) - object.size(list())
8 bytes
> object.size(lst[1:2]) - object.size(list())
16 bytes
整个列表结构需要40个字节。每个元素都是0个字节。每个指针是8个字节。所以40 + 1000 * 0 + 1000 * 8 = 8040字节。
这提供了list
的含义:
> .Internal(inspect(list()))
@586b6690 19 VECSXP g0c0 [] (len=0, tl=0)
内存中指向具有特定类型(VECSXP
)的结构的位置,该结构具有与内存管理g0c0
相关的特定状态以及有关其长度的属性等;这种结构显然占用了40个字节。列表是递归的,因为它包含的对象每个都具有类似于列表的数据结构
> .Internal(inspect(list(1)))
@585b35d8 19 VECSXP g0c1 [] (len=1, tl=0)
@585b3578 14 REALSXP g0c1 [] (len=1, tl=0) 1
> .Internal(inspect(list(1:3)))
@5872ca98 19 VECSXP g0c1 [] (len=1, tl=0)
@584fc9b8 13 INTSXP g0c2 [] (len=3, tl=0) 1,2,3
> .Internal(inspect(list(1, 2)))
@584fc980 19 VECSXP g0c2 [] (len=2, tl=0)
@5872c918 14 REALSXP g0c1 [] (len=1, tl=0) 1
@5872c8e8 14 REALSXP g0c1 [] (len=1, tl=0) 2
实际上,NULL
由一个对象表示,并占用内存。
> .Internal(inspect(NULL))
@1169b08 00 NILSXP g0c0 [NAM(2)]
R会话中只有一个NULL
对象,object.size
不会将其归因于列表。
我不知道您的row
究竟是什么,或者您使用的是32位还是64位操作系统,或者您正在使用的是哪个版本的R.我有
> sessionInfo()
R version 3.0.0 Patched (2013-04-03 r62485)
Platform: x86_64-unknown-linux-gnu (64-bit)
答案 2 :(得分:1)
列表可以包含可变长度的元素。只有数据帧才会有相同长度的行。
l<-list(c(1,2), "klklkl", 3:10)
l<-list(c(1,2), "klklkl", 3:10)
object.size(l) ---200 bytes
object.size(l[1]) --71 bytes