我刚才意识到如果你创建一个带整数值的矩阵,它们就会被存储为数字。
a <- matrix(c(0,1,0,1), ncol=2)
class(a[1,]) # numeric
整数矩阵需要一半的内存量(对于大尺寸)。 以下函数将所有值强制转换为整数:
forceMatrixToInteger <- function(m){
apply (m, c (1, 2), function (x) {
(as.integer(x))
})
}
a <- forceMatrixToInteger(a)
class(a[1,]) # integer
我想知道您是否可以考虑采用其他任何方式来实现此目标,以及它是否会更快或更高效。
sessionInfo
R version 3.2.3 (2015-12-10)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.11.3 (El Capitan)
编辑:第一次测试
我定义了一个函数,它执行Richard Scriven回答描述的函数,以及我定义的函数和测试速度。
exp_size <- 4
exp_reps <- 3
mat <- matrix(sample(c(0,1), 10^exp_size, replace=TRUE),ncol=10^(exp_size/2))
fun1<-function(){
mode(mat) <- 'integer'
}
time <- proc.time()
for (i in 1:10^exp_reps){
fun1()
}
time <- proc.time()-time
print('Results fun1:')
print(time)
print(time)
# user system elapsed
# 0.096 0.035 0.132
fun2 <- function(){
apply (mat, c (1, 2), function (x) {
(as.integer(x))
})
}
time <- proc.time()
for (i in 1:10^exp_reps){
fun2()
}
time <- proc.time()-time
print('Results fun2:')
print(time)
# user system elapsed
# 22.592 0.148 22.775
有明显的赢家。
答案 0 :(得分:10)
如果你执行c(0, 1, 0, 1)
,似乎你会创建整数,但实际上你正在创建一个双精度矢量。对于整数,您必须使用c(0L, 1L, 0L, 1L)
或rep(0:1, 2)
(因为:
创建一个整数向量)。要将矩阵更改为整数,可以更改其内部存储模式。
a <- matrix(c(0,1,0,1), ncol=2)
object.size(a)
# 232 bytes
mode(a) <- "integer"
object.size(a)
# 216 bytes
我不知道它有多快,但它很容易。