我正在尝试从循环写入R中的数据帧,例如像这样的循环>
for (i in 1:20) {
print(c(i+i,i*i,i/1))}
并将3行的每一行写入具有三列的数据框中,以便每次迭代都采用新行。我已经尝试过使用矩阵,ncol = 3并按行填充,但只能从循环中获取最后一项。
感谢。
答案 0 :(得分:23)
你可以使用rbind:
d <- data.frame()
for (i in 1:20) {d <- rbind(d,c(i+i, i*i, i/1))}
答案 1 :(得分:10)
另一种方式是
do.call("rbind", sapply(1:20, FUN = function(i) c(i+i,i*i,i/1), simplify = FALSE))
[,1] [,2] [,3]
[1,] 2 1 1
[2,] 4 4 2
[3,] 6 9 3
[4,] 8 16 4
[5,] 10 25 5
[6,] 12 36 6
如果您未指定simplify = FALSE
,则必须使用t
转置结果。对于大型结构来说,这可能是乏味的。
如果你有一个大的数据集和/或你需要重复这么多次,这个解决方案特别方便。
我在这个“线程”中提供了一些解决方案。
> system.time(do.call("rbind", sapply(1:20000, FUN = function(i) c(i+i,i*i,i/1), simplify = FALSE)))
user system elapsed
0.05 0.00 0.05
> system.time(ldply(1:20000, function(i)c(i+i, i*i, i/1)))
user system elapsed
0.14 0.00 0.14
> system.time({d <- matrix(nrow=20000, ncol=3)
+ for (i in 1:20000) { d[i,] <- c(i+i, i*i, i/1)}})
user system elapsed
0.10 0.00 0.09
> system.time(ldply(1:20000, function(i)c(i+i, i*i, i/1)))
user system elapsed
62.88 0.00 62.99
答案 2 :(得分:6)
如果您的所有值都具有相同的类型并且您知道行数,则可以通过以下方式使用矩阵(这将非常快):
d <- matrix(nrow=20, ncol=3)
for (i in 1:20) { d[i,] <- c(i+i, i*i, i/1)}
如果您需要数据框,可以使用rbind(如另一个答案所示), 或包plyr的功能如下:
library(plyr)
ldply(1:20, function(i)c(i+i, i*i, i/1))
答案 3 :(得分:4)
For
循环有副作用,因此通常的做法是在循环之前创建一个空数据帧,然后在每次迭代时添加它。您可以将其实例化为正确的大小,然后在每次迭代时将值分配给i
'行,或者添加到其中并使用rbind()
重新分配整个内容。
前一种方法对大型数据集具有更好的性能。