快速读取整数矩阵

时间:2013-10-17 15:06:53

标签: r io

我正在尝试在 R 中阅读一张大表(大约500000 x 1000)。

read.table有效,但速度非常慢。

scan也有效,并且速度正常,但我无法将其格式更改为正常的data.frame或矩阵。

我事先不知道表格中的行数(我可以通过template_line <- read.table(nrow=1,file=my_file)找到列数)。它需要与 R 2.15兼容 - 所以看起来fread是不可能的。

所以问题是:如何转换输出:

my_matrix <- scan(file=my_file,what=template_line);  

到data.frame或矩阵(快)?

或者:如果我不知道尺寸,如何在 R 中快速读取整数表?

1 个答案:

答案 0 :(得分:0)

这个怎么样?

num_cols <- 5
my_matrix <- matrix(scan(file=my_file, what=template_line), ncol=num_cols, byrow=TRUE)