我试图在R中进行大量计算。十八小时过去了,但我的RStudio似乎仍在继续工作。我不确定我是否可以用不同的方式编写脚本以使其更快。我试图在50000乘350矩阵上实现Crank–Nicolson type method,如下所示:
#defining the discretization of cells
dt<-1
t<-50000
dz<-0.0075
z<-350*dz
#velocity & diffusion
v<-2/(24*60*60)
D<-0.02475/(24*60*60)
#make the big matrix (all filled with zeros)
m <- as.data.frame(matrix(0, t/dt+1, z/dz+2)) #extra columns/rows for boundary conditions
#fill the first and last columns with constant boundary values
m[,1]<-400
m[,length(m)]<-0
#implement the calculation
for(j in 2:(length(m[1,])-1)){
for(i in 2:length(m[[1]])){
m[i,][2:length(m)-1][[j]]<-m[i-1,][[j]]+
D*dt*(m[i-1,][[j+1]]-2*m[i-1,][[j]]+m[i-1,][[j-1]])/(dz^2)-
v*dt*(m[i-1,][[j+1]]-m[i-1,][[j-1]])/(2*dz)
}}
有没有办法知道R需要多长时间才能实现它?有没有更好的方法来构建数值计算?在这一点上,我觉得excel本来可以更快!!
答案 0 :(得分:4)
在这里做一些简单的优化确实有帮助。我的笔记本电脑上的代码的原始版本代码需要大约5天。使用矩阵并只计算一次在循环中重用的值,我们将其降低到大约7分钟
考虑像
这样的混乱结构m[i,][2:length(m)-1][[j]]
这相当于
m[[i, j]]
会更快(也更容易理解)。进行此更改可将运行时间再减少2倍,大约为3分钟
把它们放在一起我们有
dt<-1
t<-50000
dz<-0.0075
z<-350*dz
#velocity & diffusion
v<-2/(24*60*60)
D<-0.02475/(24*60*60)
#make the big matrix (all filled with zeros)
m <- (matrix(0, t/dt+1, z/dz+2)) #extra columns/rows for boundary conditions
# cache a few values that get reused many times
NC = NCOL(m)
NR = NROW(m)
C1 = D*dt / dz^2
C2 = v*dt / (2*dz)
#fill the first and last columns with constant boundary values
m[,1]<-400
m[,NC]<-0
#implement the calculation
for(j in 2:(NC-1)){
for(i in 2:NR){
ma = m[i-1,]
ma.1 = ma[[j+1]]
ma.2 = ma[[j-1]]
m[[i,j]] <- ma[[j]] + C1*(ma.1 - 2*ma[[j]] + ma.2) - C2*(ma.1 - ma.2)
}
}
如果你需要比这更快,你可以尝试更多优化。例如,请参阅here,了解索引同一元素的不同方式如何具有非常不同的执行时间。通常,最好首先引用列,然后引用行。
如果您在R中执行的所有优化都不足以满足您的速度要求,那么您可以在RCpp中实现循环。