因此,MPI代码中的以下行会导致段错误:
myA = new double[numMyElements*numRows];
,其中 numMyElements 和 numRows 都是 int -s且无他们是垃圾。在我的测试中 numMyElements * numRows = 235074 。上面的代码行在对象的构造函数中调用, double * myA 是该类的成员。我正在使用:
g ++(Ubuntu / Linaro 4.6.3-1ubuntu5)4.6.3 和 mpirun(Open MPI)1.4.3
现在我只用一个处理器运行这个程序,即
mpirun -np 1 ./program
在我的笔记本电脑上。
我得到的确切错误如下:
[user:03753] *** Process received signal ***
[user:03753] Signal: Segmentation fault (11)
[user:03753] Signal code: (128)
[user:03753] Failing at address: (nil)
之后我的代码挂起,我必须手动中止它。我不认为我已经没有堆了,因为通过 top 查看流程时,程序只使用了2.1%的内存。
然而!有趣的是,如果我减小尺寸,即用一个小的常数(如10或100)替换 numMyElements * numRows ,我就不会收到错误。我不能超过1000.
myA = new double[1000];
会再次导致相同的错误。
以防我的ulimit -a输出:
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 31438
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 31438
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
有谁知道这里会发生什么?谢谢!
答案 0 :(得分:0)
正如评论中所提到的,事实证明这只是一个错误的数组索引问题,与错误弹出的位置无关。感谢您的评论!