使用R中的并行包减少时间计算

时间:2015-04-25 19:51:34

标签: r performance for-loop parallel-processing vectorization

我搜索了但是我找不到类似的问题,所以如果这是一个重复的问题,请提前道歉。我正在尝试从R中的for循环内生成数据帧。

我想要做的是使用并行包来计算N=10^9个不同值的函数。

所以这就是我做的代码:

1-生成数据样本和模型的所有参数:

Data=data.frame(C=rnorm(10,150,12),K=rnorm(10,95,7),S=rnorm(10,125,9.5),T=rnorm(10,25,5))
round(Data, digits = 0)
para_h<-c(0.001,0.002,0.0000154,0.00052,-0.68)

2-我使用的功能:

FC_Q<-function(x,para_h,Data){
  T=Data$T; S=Data$S; K=Data$K; r=0.05/250
  w=para_h[1];b=para_h[2];a=para_h[3];  c= para_h[4];  neta=para_h[5]

  nu=(1/(neta^2))*(((1-2*neta)^(1/2))-1)
  u=1i*x ; Z=length(S)

  FC_Q <- rep(NA, Z)
  for (i in 1:Z){
    A_Q=0 ; B_Q=0
    steps<-round(T[i]*250,0)  
    for (j in 1:steps){
      A_Q= A_Q+ r*u + w*B_Q-(1/2)*log(1-2*a*(neta^4)*B_Q)
      B_Q= b*B_Q+u*nu+ (1/neta^2)*(1-sqrt((1-2*a*(neta^4)*B_Q)*( 1- 2*c*B_Q - 2*u*neta)))
    }
    FC_Q[i]= exp(log(S[i])*u + A_Q + B_Q*(0.0012))*exp(-r*T[i])
  }
  return(FC_Q)
}

我遇到的问题是由于计算维度N=10^9,我的计算机需要1个小时。

这是我用循环for进行cumputation的代码。

N=10^9 ; alpha=2 ; delta= 0.25; lambda=(2*pi)/(N*delta); r=0.05/250

Res=c()
for (i in 1:N){
  phi= ((FC_Q(((delta*(i-1))-(alpha+1)*1i),para_h,Data))/(alpha^2+alpha-(delta*(i-1))^2+1i*(2*alpha+1)*(delta*(i-1))))*delta*exp(1i*(delta*(i-1))*b)
  Res=rbind(Res,phi)
}  

这段代码需要花费很多时间,我想要使用的是:

library(parallel)
cl <- makeCluster(detectCores())
result <- clusterApply(cl,1:10^9,FC_Q)
values <- do.call(rbind,result)
stopCluster(cl)

是否可以使用并行包减少执行时间,如果是这样,请建议我一个解决方案。我知道,我为R使用了很多不好的东西,但我找不到更好的解决方案。

任何纠正和建议,以改善这一过程!请随时在R中分享您现有的代码。

感谢。

1 个答案:

答案 0 :(得分:0)

你的问题有点开放。 如果您的目标是在多个核心/处理器上运行代码,那么最简单的解决方案之一就是使用并行包中的mclapply。由于它使用分叉,因此它无法在Windows机器上开箱即用。

使用它:

num_cores <- 12
res <- mclapply(1:N, function(i) ((FC_Q(((delta*(i-1))-(alpha+1)*1i),para_h,Data))/(alpha^2+alpha-(delta*(i-1))^2+1i*(2*alpha+1)*(delta*(i-1))))*delta*exp(1i*(delta*(i-1))*b), 
                mc.cores = num_cores)

mclapply返回一个列表。