如何在Windows中调试(逐行)Rcpp生成的代码?

时间:2018-12-04 22:23:03

标签: c++ r rcpp

我正在尝试在运行时调试Rcpp编译的代码。很长一段时间以来,我一直在努力使这项工作无法成功进行。 在这里提出了一个非常相似的问题:Debugging (line by line) of Rcpp-generated DLL under Windows,它提出了相同的问题,但是问题和答案都远远超出了我的理解。

这是我所拥有的:

Windows 7 Pro SP1
R 3.5
Rstudio 1.1.463 with Rcpp.
Rbuild Tools from Rstudio. (c++ compiler)

程序: 在Rstudio的File-> New File-> C ++ File中(创建一个带有timesTwo函数的示例文件。)

我在此文件中添加了一个新功能:

// [[Rcpp::export]]
NumericVector timesTwo2(NumericVector x) {
  for(int ii = 0; ii <= x.size(); ii++)
  {
    x.at(ii) = x.at(ii) * 2;
  }
  return x;
}

我在“保存”中选中了“源”,并将文件另存为RcppTest.cpp,它成功地获取或编译了文件。

在Rstudio中运行代码:

data = c(1:10)
data
[1]  1  2  3  4  5  6  7  8  9 10
timesTwo2(data)
Error in timesTwo2(data) : Index out of bounds: [index=10; extent=10].

错误是因为在for循环中<= x.size(),所以结果是运行时错误。

问题是如何获得有关此错误的调​​试输出,以合理地告诉我发生了什么? 至少我想知道代码中触发异常的行以及带有哪些参数的行。 此外,我真的很想在异常发生之前逐行执行代码,以便我可以准确地监视正在发生的事情。

我可以安装任何其他程序或应用任何其他设置,只要我可以找到有关执行该操作的确切详细信息即可。现在,我只是从头开始,只是要使其正常工作。谢谢。

更新: 我找到了这个网站:Debugging Rcpp c++ code using gdb 我在gdb上安装了最新的gcc 8.1

我在位于C:\ Program Files \ R \ R-3.5.1 \ etc \ x64的makeconf文件中找到了CXXFLAGS 然后我按照建议启动了Rgui,但是当我尝试Rcpp ::: sourceCpp时出现错误:

> library(Rcpp)
> Rcpp::sourceCpp('Rcpptest.cpp')
C:/PROGRA~1/R/R-35~1.1/etc/x64/Makeconf:230: warning: overriding recipe for target '.m.o'
C:/PROGRA~1/R/R-35~1.1/etc/x64/Makeconf:223: warning: ignoring old recipe for target '.m.o'
c:/Rtools/mingw_64/bin/g++  -I"C:/PROGRA~1/R/R-35~1.1/include" -DNDEBUG   -I"C:/Users/Michael/Documents/R/win-library/3.5/Rcpp/include" -I"C:/PROGRA~1/R/R-35~1.1/bin/x64"        -ggdb -O0 -Wall -gdwarf-2 -mtune=generic -c Rcpptest.cpp -o Rcpptest.o
process_begin: CreateProcess(NULL, c:/Rtools/mingw_64/bin/g++ -IC:/PROGRA~1/R/R-35~1.1/include -DNDEBUG -IC:/Users/Michael/Documents/R/win-library/3.5/Rcpp/include -IC:/PROGRA~1/R/R-35~1.1/bin/x64 -ggdb -O0 -Wall -gdwarf-2 -mtune=generic -c Rcpptest.cpp -o Rcpptest.o, ...) failed.
make (e=2): The system cannot find the file specified.

make: *** [C:/PROGRA~1/R/R-35~1.1/etc/x64/Makeconf:215: Rcpptest.o] Error 2
Error in Rcpp::sourceCpp("Rcpptest.cpp") : 
  Error 1 occurred building shared library.

WARNING: The tools required to build C++ code for R were not found.

Please download and install the appropriate version of Rtools:

http://cran.r-project.org/bin/windows/Rtools/

看起来它正在加载新的CXXFLAGS,并且正在使用DEBUG,但似乎仍然无法编译。有人从错误中知道原因吗?

我尝试以与Rgui相同的方式运行Rstudio,它开始时在gdb窗口中显示了许多线程,但是Rstudio中的所有内容都像以前一样运行,没有来自Rstudio或gdb的其他调试信息。

更新2: 由于上面的错误指出Rgui没有要编译的Rtools,因此我从提供链接安装了Rtools。它安装在C:\ Rtools中,而Rstudio安装在C:\ RBuildTools中。所以我现在有3个编译器,Rtools,RbuildTools和带有dgb的gcc。 它现在可以编译,但是仍然给出与在Rstudio中相同的错误。我至少希望获得更好的错误输出,例如传递的行和值。 指示说Rgui应该有一个断点,但是我找不到这样的选择。

更新3 我终于能够设置并运行Linux安装(Ubuntu 16.04.05)。 首先是我的CXXFLAGS:     $ R CMD配置CXXFLAGS     -g -O0 -fstack-protector-strong -Wformat -Werror = format-security -Wdate-time -D_FORTIFY_SOURCE = 2 -g 我必须在主目录中创建一个.R文件夹,并在其中仅使用CXXFLAGS = -g -O0 -Wall -pedantic -fstack-protector-strong -D_FORTIFY_SOURCE=2行创建一个Makevar文件。 仅此一项就花费了几个小时,实际上没有人说过要创建文件夹和文件。

然后我在断点处执行了Ralf发布的命令:

> timesTwo2(d1)

Thread 1 "R" hit Breakpoint 1, timesTwo2 (x=...) at RcppTest.cpp:19
19  NumericVector timesTwo2(NumericVector x) {
(gdb) n
20    for (int ii = 0; ii <= x.size(); ii++)
(gdb) n
22      x.at(ii) = x.at(ii) * 2;
(gdb) display ii
1: ii = 0
(gdb) n
20    for (int ii = 0; ii <= x.size(); ii++)
1: ii = 0
(gdb) n
22      x.at(ii) = x.at(ii) * 2;
1: ii = 1
(gdb) n
20    for (int ii = 0; ii <= x.size(); ii++)
1: ii = 1
(gdb) display x.at(ii)
2: x.at(ii) = <error: Attempt to take address of value not located in memory.>
(gdb) n
22      x.at(ii) = x.at(ii) * 2;
1: ii = 2
2: x.at(ii) = <error: Attempt to take address of value not located in memory.>
(gdb) 

最后是n = 10:

1: ii = 10
2: x.at(ii) = <error: Attempt to take address of value not located in memory.>
(gdb) n
0x00007ffff792d762 in Rf_applyClosure () from /usr/lib/R/lib/libR.so
(gdb) 

这绝对是我进行调试的最深入的地方,但这是一个非常基本的功能,调试输出甚至错误输出不是很有用。它给了我它正在执行的行,并且可以显示ii,但是我无法显示数组值或整个数组。是否可以创建一个更具体的断点,使其仅在ii == 10时才断点? 理想情况下,我希望在Rstudio或其他可以显示整个矢量的GUI中使用它。仍在进行更多测试。

2 个答案:

答案 0 :(得分:4)

我在下面的原始答案中也建议使用通常的方法R -d gdb,但在Windows上不起作用:

  

-debugger = name
  -d名称

     

(仅仅UNIX )通过调试器名称运行R。对于大多数调试器(valgrind和gdb的最新版本除外),将忽略其他命令行选项,而是从调试器内部启动R可执行文件时应使用其他命令行选项。

https://cran.r-project.org/doc/manuals/r-release/R-intro.html#Invoking-R-from-the-command-line

替代:

  1. 在调试器中启动R:gdb.exe Rgui.exe
  2. 设置断点:break TimesTwo2
  3. 运行R:run
  4. 源文件:Rcpp::sourceCpp("debug.cpp")
  5. 使用nextprintdisplay浏览代码。

步骤1的替代方法是启动R,使用Sys.getpid()获取PID,并使用gdb -p <pid>附加调试器。然后,您将不得不使用continue而不是run


我现在没有Windows计算机,因此在Linux上完成了以下操作。我希望它可以转让。让我们从一个包含您的代码的简单cpp文件(在我的情况下为debug.cpp)开始:

#include <Rcpp.h>
using Rcpp::NumericVector;

// [[Rcpp::export]]
NumericVector timesTwo2(NumericVector x) {
  for(int ii = 0; ii <= x.size(); ii++)
  {
    x.at(ii) = x.at(ii) * 2;
  }
  return x;
}

/*** R
data = c(1:10)
data
timesTwo2(data)
*/

我可以通过在命令行上调用R来重现该错误:

$ R -e "Rcpp::sourceCpp('debug.cpp')"

R version 3.5.1 (2018-07-02) -- "Feather Spray"
[...]

> Rcpp::sourceCpp('debug.cpp')

> data = c(1:10)

> data
 [1]  1  2  3  4  5  6  7  8  9 10

> timesTwo2(data)
Error in timesTwo2(data) : Index out of bounds: [index=10; extent=10].
Calls: <Anonymous> ... source -> withVisible -> eval -> eval -> timesTwo2 -> .Call
Execution halted

接下来,我们可以以gdb作为调试器开始R(如Dirk所说的 Writing R Extensions ):

$ R -d gdb -e "Rcpp::sourceCpp('debug.cpp')"
GNU gdb (Debian 8.2-1) 8.2
[...]
(gdb) break timesTwo2
Function "timesTwo2" not defined.
Make breakpoint pending on future shared library load? (y or [n]) y
Breakpoint 1 (timesTwo2) pending.
(gdb) run
[...]
> Rcpp::sourceCpp('debug.cpp')
[Thread 0xb40d3b40 (LWP 31793) exited]
[Detaching after fork from child process 31795]

> data = c(1:10)

> data
 [1]  1  2  3  4  5  6  7  8  9 10

> timesTwo2(data)

Thread 1 "R" hit Breakpoint 1, 0xb34f3310 in timesTwo2(Rcpp::Vector<14, Rcpp::PreserveStorage>)@plt ()
   from /tmp/RtmphgrjLg/sourceCpp-i686-pc-linux-gnu-1.0.0/sourcecpp_7c2d7f56744b/sourceCpp_2.so
(gdb)

此时,您可以使用next(或仅n)单步执行程序,并使用print(或仅p)输出变量。一个有用的命令是aldo display

Thread 1 "R" hit Breakpoint 1, timesTwo2 (x=...) at debug.cpp:5
5   NumericVector timesTwo2(NumericVector x) {
(gdb) n
6     for(int ii = 0; ii <= x.size(); ii++)
(gdb) n
8       x.at(ii) = x.at(ii) * 2;
(gdb) display ii
2: ii = 0
(gdb) n
8       x.at(ii) = x.at(ii) * 2;
2: ii = 0

[...]

2: ii = 9
(gdb) 
46          inline proxy ref(R_xlen_t i) { return start[i] ; }
2: ii = 9
(gdb) 
6     for(int ii = 0; ii <= x.size(); ii++)
2: ii = 10
(gdb) 
8       x.at(ii) = x.at(ii) * 2;
2: ii = 10
(gdb) 
Error in timesTwo2(data) : Index out of bounds: [index=10; extent=10].
Calls: <Anonymous> ... source -> withVisible -> eval -> eval -> timesTwo2 -> .Call
Execution halted
[Detaching after fork from child process 32698]
[Inferior 1 (process 32654) exited with code 01]

顺便说一句,我使用了以下编译标志:

$ R CMD config CXXFLAGS
-g -O2 -Wall -pedantic -fstack-protector-strong -D_FORTIFY_SOURCE=2

您可能想切换到-O0

答案 1 :(得分:1)

这可以通过Visual Studio Code完成,因为它可以处理RC++。这样一来,您就可以在GUI环境中一次浏览一行Rcpp代码。

请参阅此demo以开始使用。