我正在使用RcppEigen为我的R代码编写一些C ++函数,我想尽可能地优化它们的编译。当我过去使用Eigen时,我从-O3和-fopenmp得到了显着的提升。在Dirk的advice之后,我编辑了〜/ .R / Makevars,以便使用这些标志编译我的Eigen代码:
CPPFLAGS=-O3 -fopenmp
这很有效 - 当我检查编译期间发生了什么(ps ax | grep cpp)时,我看到了:
27097 pts/6 R+ 0:00 /usr/libexec/gcc/x86_64-redhat-linux/4.4.7/cc1plus -quiet -I/usr/include/R -I/home/sf/R/x86_64-redhat-linux-gnu-library/3.0/Rcpp/include -I/home/sf/R/x86_64-redhat-linux-gnu-library/3.0/RcppEigen/include -D_GNU_SOURCE -D_REENTRANT -DNDEBUG -D_FORTIFY_SOURCE=2 file69b757e053ad.cpp -quiet -dumpbase file69b757e053ad.cpp -m64 -mtune=generic -auxbase-strip file69b757e053ad.o -g -O3 -O2 -Wall -fopenmp -fpic -fexceptions -fstack-protector --param ssp-buffer-size=4 -o -
我想要的旗帜在那里,-O3和-fopenmp。但是我也看到-O2,这可能是系统范围的默认值(我通过删除〜/ .R / Makevars来验证这一点,实际上,-O2就在那里但-O3和-fopenmp不存在。)
所以问题是:如何摆脱-O2?或者,它真的重要吗? g ++手册页说:
-O3 Optimize yet more. -O3 turns on all optimizations specified by -O2 and also
turns on the -finline-functions, -funswitch-loops, -fpredictive-commoning, -fgcse-
after-reload, -ftree-vectorize and -fipa-cp-clone options.
所以也许可以同时拥有-O2和-O3?
答案 0 :(得分:2)
我认为您CXXFLAGS
CPPFLAGS
而不是~/.R/Makevars
我在下面的repo中设置Makevars来对R / Rcpp中的各种C ++编译器标志进行基准测试 https://github.com/jackwasey/optimization-comparison
我使用https://github.com/jimhester/covr中的函数以编程方式执行此操作,如果这对您有用。
另外,你有没有看到以下内容? R: C++ Optimization flag when using the inline package