正如问题标题所示,我想知道为什么字节编译的R代码(使用compiler::cmpfun
)比以下数学函数的等效Rcpp代码更快:
func1 <- function(alpha, tau, rho, phi) {
abs((alpha + 1)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}
由于这是一个简单的数值运算,我原本期望Rcpp(funcCpp
和funcCpp2
)比编译的字节R(func1c
和func2c
快得多),特别是因为R会有更多的开销来存储(1+alpha)**tau
或需要重新计算它。事实上,计算这个指数两次似乎比R中的内存分配更快(func1c
vs func2c
),这似乎特别违反直觉,因为n
很大。我的另一个猜测是,可能compiler::cmpfun
正在扯掉一些魔法,但我想知道是否确实如此。
所以,我真正想知道的两件事是:
为什么funcCpp和funcCpp2比func1c和func2c慢? (Rcpp比编译的R函数慢)
为什么funcCpp比func2慢? (Rcpp代码比纯R慢)
FWIW,这是我的C ++和R版本数据
user% g++ --version
Configured with: --prefix=/Library/Developer/CommandLineTools/usr --with-gxx-include-dir=/usr/include/c++/4.2.1
Apple LLVM version 7.0.0 (clang-700.0.72)
Target: x86_64-apple-darwin14.3.0
Thread model: posix
user% R --version
R version 3.2.2 (2015-08-14) -- "Fire Safety"
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-apple-darwin14.5.0 (64-bit)
这里是R和Rcpp代码:
library(Rcpp)
library(rbenchmark)
func1 <- function(alpha, tau, rho, phi) {
abs((1 + alpha)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}
func2 <- function(alpha, tau, rho, phi) {
pval <- (alpha + 1)^(tau)
abs( pval * phi - rho * (1- pval)/(1 - (1 + alpha)))
}
func1c <- compiler::cmpfun(func1)
func2c <- compiler::cmpfun(func2)
func3c <- Rcpp::cppFunction('
double funcCpp(double alpha, int tau, double rho, double phi) {
double pow_val = std::exp(tau * std::log(alpha + 1.0));
double pAg = rho/alpha;
return std::abs(pow_val * (phi - pAg) + pAg);
}')
func4c <- Rcpp::cppFunction('
double funcCpp2(double alpha, int tau, double rho, double phi) {
double pow_val = pow(alpha + 1.0, tau) ;
double pAg = rho/alpha;
return std::abs(pow_val * (phi - pAg) + pAg);
}')
res <- benchmark(
func1(0.01, 200, 100, 1000000),
func1c(0.01, 200, 100, 1000000),
func2(0.01, 200, 100, 1000000),
func2c(0.01, 200, 100, 1000000),
func3c(0.01, 200, 100, 1000000),
func4c(0.01, 200, 100, 1000000),
funcCpp(0.01, 200, 100, 1000000),
funcCpp2(0.01, 200, 100, 1000000),
replications = 100000,
order='relative',
columns=c("test", "replications", "elapsed", "relative"))
这是rbenchmark
的输出:
test replications elapsed relative
func1c(0.01, 200, 100, 1e+06) 100000 0.349 1.000
func2c(0.01, 200, 100, 1e+06) 100000 0.372 1.066
funcCpp2(0.01, 200, 100, 1e+06) 100000 0.483 1.384
func4c(0.01, 200, 100, 1e+06) 100000 0.509 1.458
func2(0.01, 200, 100, 1e+06) 100000 0.510 1.461
funcCpp(0.01, 200, 100, 1e+06) 100000 0.524 1.501
func3c(0.01, 200, 100, 1e+06) 100000 0.546 1.564
func1(0.01, 200, 100, 1e+06) 100000 0.549 1.573K
答案 0 :(得分:5)
这基本上是一个不合适的问题。当你提出
func1 <- function(alpha, tau, rho, phi) {
abs((alpha + 1)^(tau) * phi - rho * (1- (1 + alpha)^(tau))/(1 - (1 + alpha)))
}
甚至没有指定参数是什么(即标量?向量?大?小?内存开销)然后你可以在最好的情况下直接从解析的表达式中获得一小组(基本的,有效的)函数调用。 / p>
自从我们有了字节编译器以来,Luke Tierney在随后的R版本中对其进行了改进,我们已经知道它可以很好地完成代数表达式。
现在,编译的C / C ++代码也做得很好 - 但是调用编译的男女同校将会有开销,你在这里看到的是&#34; rtivial够&#34;问题,开销并没有真正摊销。
所以你最终得到了很多平局。据我所知,并不奇怪。