预分配和优化循环

时间:2018-07-03 06:32:17

标签: r for-loop dataframe optimization

我的R脚本的格式为:

for (j in 1:N) {

                  #construct the DF2 data frame 
                  #operations on the DF2 data frame 
}

N可能很大(例如1百万)。 DF2的列已定义 一个接一个的公式:

DF2$column_i <- function(x,f..) #or constant or ....

DF $ column_i可以是常量,函数或“ while”循环。我尝试使用以下方法预先分配定义DF2的内容:

DF2 <- data.frame(matrix(nrow=..,ncol=..))

并在DF2$column_i列之后进行计算,但是我没有任何好处。

有人有什么想法吗?

1 个答案:

答案 0 :(得分:0)

我的代码是以下类型:

par <- data.frame(CA=runif(n = 50, min = 70000, max = 100000),
              D=round(runif(n = 50, min = 70, max = 90),0),
              P=runif(n = 50, min = 900, max = 20000),
              A=round(runif(n = 50, min = 50, max = 70),0))

parpa <- data.frame(matrix(nrow = nrow(par), ncol = 3*V))

comp <- function(CA, D, P, A){
vect <- rep('numeric', 3*V)

b <- 1
k <- 1 
while (((b+1) <= (D+1))&(k < V)) { 
a <- b+1
b <- min((a+8-1), (D+1))
vect[c(1+4*k, 2+4*k, 3+4*k, 4+4*k)] <- c(mean(DF2$Z[a:b]), sum(DF2$X[a:b]),
                                        mean(DF2$Q[a:b]), sum(DF2$AE[a:b]))
k <- k+1
}
return(vect)                       
}

#loop
for (j in 1:nrow(par)) {

CA <- par$CA[j] 
D <- par$D[j] 
R <- 0.01*D 
P <- par$P[j] 
A <- par$A[j]
COST <- 500    
V <- 5
#DF2
DF2 <- data.frame(M=0:D)
OB <- function(x) {
c <- COST*D*DF2$M/R
return(c)
}
DF2$O <- O(D)
DF2$E <- (D*DF2$M+2)/D*(D+4)
DF2$Q <- (CA-DF2$M)*D
DF2$X <- (CA-DF2$O)*(DF2$E+P)
Func <- function(x) {return(round(x/30, 2))}
DF2$Z[(A+2):(D+1)] <- sapply(DF2$E[(A+2):(D+1)], Func)

parpa[j,] <- comp(CA, D, P, A)
}