c ++ system()引发了ENOMEM

时间:2015-10-01 16:55:15

标签: c++ c++11 gdb errno

此问题是此M(not)WEquestion。我写了一个代码来重现错误:

#include <cstdlib>
#include <iostream>
#include <vector>

int *watch_errno = __errno_location();

int main(){
    std::vector<double> a(7e8,1);  // allocate a big chunk of memory
    std::cout<<system(NULL)<<std::endl;
}

必须使用g++ -ggdb -std=c++11(在Debian上使用g ++ 4.9)进行编译。注意 int *watch_errno仅用于允许gdb观看errno

当它在gdb下运行时,我明白了:

(gdb) watch *watch_errno 
Hardware watchpoint 1: *watch_errno
(gdb) r
Starting program: /tmp/bug 
Hardware watchpoint 1: *watch_errno

Old value = <unreadable>
New value = 0
__static_initialization_and_destruction_0 (__initialize_p=1, __priority=65535) at bug.cpp:10
10      }
(gdb) c
Continuing.
Hardware watchpoint 1: *watch_errno

Old value = 0
New value = 12
0x00007ffff7252421 in do_system (line=line@entry=0x7ffff7372168 "exit 0") at ../sysdeps/posix/system.c:116
116     ../sysdeps/posix/system.c: No such file or directory.
(gdb) bt
#0  0x00007ffff7252421 in do_system (line=line@entry=0x7ffff7372168 "exit 0") at ../sysdeps/posix/system.c:116
#1  0x00007ffff7252510 in __libc_system (line=<optimized out>) at ../sysdeps/posix/system.c:182
#2  0x0000000000400ad8 in main () at bug.cpp:9
(gdb) l
111     in ../sysdeps/posix/system.c
(gdb) c
Continuing.
0
[Inferior 1 (process 5210) exited normally]

出于某种原因,errno在第9行设置为ENOMEM,对应于 system()致电。请注意,如果矢量具有较小的尺寸(我猜它 取决于您运行代码的计算机),代码工作正常 当shell可用时,system(NULL)将返回1。

为什么标志ENOMEM被提升?为什么不使用交换内存的代码?这是一个错误吗?有解决方法吗? popenexec*会这样做吗? (我知道,我应该只针对每个帖子提出一个问题,但所有这些问题都可以归结为,&#34;发生了什么?&#34;)

根据要求,这是ulimit -a

的结果
-t: cpu time (seconds)              unlimited
-f: file size (blocks)              unlimited
-d: data seg size (kbytes)          unlimited
-s: stack size (kbytes)             8192
-c: core file size (blocks)         0
-m: resident set size (kbytes)      unlimited
-u: processes                       30852
-n: file descriptors                65536
-l: locked-in-memory size (kbytes)  64
-v: address space (kbytes)          unlimited
-x: file locks                      unlimited
-i: pending signals                 30852
-q: bytes in POSIX msg queues       819200
-e: max nice                        0
-r: max rt priority                 0
-N 15:                              unlimited

这里是strace -f myprog

的相关部分
mmap(NULL, 5600002048, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7faa98562000
rt_sigaction(SIGINT, {SIG_IGN, [], SA_RESTORER, 0x7fabe622b180}, {SIG_DFL, [], 0}, 8) = 0
rt_sigaction(SIGQUIT, {SIG_IGN, [], SA_RESTORER, 0x7fabe622b180}, {SIG_DFL, [], 0}, 8) = 0
rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
clone(child_stack=0, flags=CLONE_PARENT_SETTID|SIGCHLD, parent_tidptr=0x7fff8797635c) = -1 ENOMEM (Cannot allocate memory)
rt_sigaction(SIGINT, {SIG_DFL, [], SA_RESTORER, 0x7fabe622b180}, NULL, 8) = 0
rt_sigaction(SIGQUIT, {SIG_DFL, [], SA_RESTORER, 0x7fabe622b180}, NULL, 8) = 0
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
fstat(1, {st_mode=S_IFCHR|0620, st_rdev=makedev(136, 1), ...}) = 0
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fabe6fde000
write(1, "0\n", 20
)                      = 2
write(1, "8\n", 28
)                      = 2
munmap(0x7faa98562000, 5600002048)      = 0

这是free的输出:

           total       used       free     shared    buffers     cached
Mem:       7915060    1668928    6246132      49576      34668    1135612
-/+ buffers/cache:     498648    7416412
Swap:      2928636          0    2928636

2 个答案:

答案 0 :(得分:2)

system()功能首先使用fork()或类似功能创建流程的新副本(在Linux中,最终会显示在clone()系统调用中,如您所示)然后,在子进程中,调用exec创建一个运行所需命令的shell。

如果新进程的虚拟内存不足,fork()调用可能会失败(即使您打算立即用更小的占用空间替换它,内核也无法知道)。有些系统允许您交换分叉大型进程的能力,以减少页面错误可能失败的保证,写入时复制(vfork())或内存过量使用(/proc/sys/vm/overcommit_memory/proc/sys/vm/overcommit_ratio

请注意,上述内容同样适用于可能创建新流程的任何库函数 - 例如popen()。虽然不是exec(),但替换进程并且不会克隆它。

如果提供的机制不适合您的用例,那么您可能需要实现自己的system()替换。我建议尽早(在分配大量内存之前)启动子进程,其唯一的工作是接受NUL - stdin上的分隔命令行并在stdout上报告退出状态。

伪代码中后一种解决方案的概述类似于:

int request_fd[2];
int reply_fd[2];

pipe(request_fd);
pipe(reply_fd);

if (fork()) {
    /* in parent */
    close(request_fd[0]);
    close(reply_fd[1]);
} else {
    /* in child */
    close(request_fd[1]);
    close(reply_fd[0]);
    while (read(request_fd[0], command)) {
        int result = system(command);
        write(reply_fd[1], result);
    }
    exit();
}

// Important: don't allocate until after the fork()
std::vector<double> a(7e8,1);  // allocate a big chunk of memory

int my_system_replacement(const char* command) {
    write(request_fd[1], command);
    read(reply_fd[0], result);
    return result;
}

通过参考手册页,您将希望在整个过程中添加适当的错误检查。而你可能希望使它更加面向对象,并且可能使用iostream进行读写操作等。

答案 1 :(得分:0)

你的行

   std::vector<double> a(7e8,1);

可能是错的。您正在调用std::vector的构造函数,该构造函数采用向量大小和初始化元素。 7e8被转换为一个巨大的尺寸(即700万个元素)。

您可能想构建一个双元素向量,因此请使用

   std::vector<double> a{7e8,1};

使用你的巨大向量,system(3)库函数将调用失败的fork(2)系统调用:

  

ENOMEM fork()未能分配必要的内核结构                 因为记忆很紧张。

也许你达到了一些限制,例如在其他地方由setrlimit(2)设置。
尝试cat /proc/self/limits找到它们(在Linux上)。

使用strace(1)(例如strace -f yourprogram)来了解正在发生的事情;环顾forkclone行......

BTW,system(3)应该在失败时返回错误代码。你应该测试一下。您可能需要拨打system("echo here pid $$");而不是system(NULL);