Question

我刚才意识到如果你创建一个带整数值的矩阵，它们就会被存储为数字。

a <- matrix(c(0,1,0,1), ncol=2)
class(a[1,]) # numeric

整数矩阵需要一半的内存量（对于大尺寸）。以下函数将所有值强制转换为整数：

forceMatrixToInteger <- function(m){
    apply (m, c (1, 2), function (x) {
         (as.integer(x))
    })
}

a <- forceMatrixToInteger(a)

class(a[1,]) # integer

我想知道您是否可以考虑采用其他任何方式来实现此目标，以及它是否会更快或更高效。

sessionInfo

R version 3.2.3 (2015-12-10)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: OS X 10.11.3 (El Capitan)

编辑：第一次测试

我定义了一个函数，它执行Richard Scriven回答描述的函数，以及我定义的函数和测试速度。

exp_size <- 4
exp_reps <- 3 
mat <- matrix(sample(c(0,1), 10^exp_size, replace=TRUE),ncol=10^(exp_size/2))

fun1<-function(){
    mode(mat) <- 'integer'
}

time <- proc.time()
    for (i in 1:10^exp_reps){
    fun1()
}
time <- proc.time()-time
print('Results fun1:')
print(time)

 print(time)
 # user  system elapsed 
 # 0.096   0.035   0.132 

fun2 <- function(){
    apply (mat, c (1, 2), function (x) {
         (as.integer(x))
    })
}

time <- proc.time()
for (i in 1:10^exp_reps){
    fun2()
}
time <- proc.time()-time
print('Results fun2:')
print(time)

# user  system elapsed 
# 22.592   0.148  22.775

有明显的赢家。

Answer 1

如果你执行c(0, 1, 0, 1)，似乎你会创建整数，但实际上你正在创建一个双精度矢量。对于整数，您必须使用c(0L, 1L, 0L, 1L)或rep(0:1, 2)（因为:创建一个整数向量）。要将矩阵更改为整数，可以更改其内部存储模式。

a <- matrix(c(0,1,0,1), ncol=2)
object.size(a)
# 232 bytes
mode(a) <- "integer"
object.size(a)
# 216 bytes

我不知道它有多快，但它很容易。

在R中将矩阵强制转换为整数矩阵的最快方法

1 个答案: