在shm_open()之后使用fallocate()会导致在shm_unlink()

时间:2019-01-10 12:53:30

标签: c linux shared-memory fallocate

我有一个使用共享内存和内存映射文件的应用程序。目标操作系统是Ubuntu 14.04(64位)。此发行版上的Linux内核的版本为4.4.0。 gcc的版本为4.8.4。

直到最近,我仍在使用以下函数调用(按所示顺序)分配和取消分配共享内存。

shm_open
ftruncate
mmap
/* use shared memory */
munmap
shm_unlink

这种方法的问题是无法检测共享内存是否有足够的可用内存。访问共享内存时,应用程序将在以后崩溃,并发出SIGBUS信号。

我发现人们有同样的问题here,他们使用fallocate()而不是ftruncate()解决了这个问题。如果没有足够的内存可用于请求的大小,fallocate()将返回错误。

我已经在我的应用程序中实现了相同的功能,fallocate()可以在没有足够的可用内存时正确检测到这种情况。但是,我现在遇到了另一个问题。

问题在于,fallocate()保留的内存在调用shm_unlink()之后没有释放。使用ftruncate()时这不是问题。

请考虑以下显示此行为的最小示例(fallocate.c)。

#include <stdio.h>
#include <string.h>

#include <errno.h>
#include <sys/mman.h>
#include <fcntl.h>

static const char* name = "/test";
static const size_t size = (size_t)4*1024*1024*1024;

int main ()
{
    int fd = shm_open(name, O_RDWR | O_CREAT | O_EXCL, S_IRWXU | S_IRWXG | S_IRWXO);
    if (fd == -1) {
        printf("shm_open failed (%s)\n", strerror(errno));
        return 1;
    }

    if (fallocate(fd, 0, 0, size)) {
        printf("fallocate failed (%s)\n", strerror(errno));
        return 1;
    }

    if (shm_unlink(name)) {
        printf("shm_unlink failed (%s)\n", strerror(errno));
        return 1;
    }

    printf("break here to check if memory still used\n");

    return 0;
}

我使用以下CMakeLists.txt进行编译

add_executable(fallocate fallocate.c)
target_compile_definitions(fallocate PRIVATE _GNU_SOURCE)
target_link_libraries(fallocate PRIVATE rt)

gdb中运行此示例,并在最后一个printf语句上中断。您将看到以下行为。

  • test中不再存在/dev/shm文件
  • 查看top输出时,内存仍处于“已使用”类别;一旦流程终止,它将仅移至“免费”类别

这是预期的行为还是我错误地使用了API?


编辑:根据要求,在shm_unlink()之后使用进程地址空间(使用gets()之后的shm_unlink()来保存进程)

cat /proc/<PID>/status的输出

Name:   fallocate
State:  S (sleeping)
Tgid:   12445
Ngid:   0
Pid:    12445
PPid:   26349
TracerPid:      0
Uid:    1001    1001    1001    1001
Gid:    1001    1001    1001    1001
FDSize: 256
Groups: 4 27 108 124 999 1001 1002
NStgid: 12445
NSpid:  12445
NSpgid: 12445
NSsid:  26349
VmPeak:     8628 kB
VmSize:     8460 kB
VmLck:         0 kB
VmPin:         0 kB
VmHWM:       840 kB
VmRSS:       840 kB
VmData:       80 kB
VmStk:       132 kB
VmExe:         4 kB
VmLib:      2052 kB
VmPTE:        36 kB
VmPMD:        12 kB
VmSwap:        0 kB
HugetlbPages:          0 kB
Threads:        1
SigQ:   0/61795
SigPnd: 0000000000000000
ShdPnd: 0000000000000000
SigBlk: 0000000000000000
SigIgn: 0000000000000000
SigCgt: 0000000180000000
CapInh: 0000000000000000
CapPrm: 0000000000000000
CapEff: 0000000000000000
CapBnd: 0000003fffffffff
CapAmb: 0000000000000000
Seccomp:        0
Speculation_Store_Bypass:       thread vulnerable
Cpus_allowed:   ff
Cpus_allowed_list:      0-7
Mems_allowed:   00000000,00000001
Mems_allowed_list:      0
voluntary_ctxt_switches:        1
nonvoluntary_ctxt_switches:     2

pmap <PID>的输出

0000000000400000      4K r-x-- fallocate
0000000000600000      4K r---- fallocate
0000000000601000      4K rw--- fallocate
00007f1e92093000    100K r-x-- libpthread-2.19.so
00007f1e920ac000   2044K ----- libpthread-2.19.so
00007f1e922ab000      4K r---- libpthread-2.19.so
00007f1e922ac000      4K rw--- libpthread-2.19.so
00007f1e922ad000     16K rw---   [ anon ]
00007f1e922b1000   1784K r-x-- libc-2.19.so
00007f1e9246f000   2048K ----- libc-2.19.so
00007f1e9266f000     16K r---- libc-2.19.so
00007f1e92673000      8K rw--- libc-2.19.so
00007f1e92675000     20K rw---   [ anon ]
00007f1e9267a000     28K r-x-- librt-2.19.so
00007f1e92681000   2044K ----- librt-2.19.so
00007f1e92880000      4K r---- librt-2.19.so
00007f1e92881000      4K rw--- librt-2.19.so
00007f1e92882000    140K r-x-- ld-2.19.so
00007f1e92a75000     16K rw---   [ anon ]
00007f1e92aa3000      4K rw---   [ anon ]
00007f1e92aa4000      4K r---- ld-2.19.so
00007f1e92aa5000      4K rw--- ld-2.19.so
00007f1e92aa6000      4K rw---   [ anon ]
00007ffe6f72b000    132K rw---   [ stack ]
00007ffe6f7ee000     12K r----   [ anon ]
00007ffe6f7f1000      8K r-x--   [ anon ]
ffffffffff600000      4K r-x--   [ anon ]
 total             8464K

2 个答案:

答案 0 :(得分:1)

shm_unlink仅删除与内存对象关联的名称。如果还有其他引用它的对象,它将不会删除该对象。您有一个打开的文件描述符,它引用了内存对象。关闭它后,引用计数应达到零,并且应释放内存。

答案 1 :(得分:1)

您没有关闭打开的文件描述符,并且共享内存“文件”很可能位于基于tmpfs内存的文件系统中(假设Linux)。

此代码创建一个文件:

int fd = shm_open(name, O_RDWR | O_CREAT | O_EXCL, S_IRWXU | S_IRWXG | S_IRWXO);

此代码变大了(4 GB):

if (fallocate(fd, 0, 0, size)) {

此代码只是将其与文件系统断开链接:

if (shm_unlink(name)) {

这时,打开的文件描述符意味着即使备份文件已经用名称从目录中删除,该备份文件仍然存在。 (这实际上是“取消链接”的意思。)在关闭到文件的最后一个链接之前,不会真正从文件系统中删除该文件-该最后一个链接是您进程的打开文件描述符。

添加

close( fd );

并在close()调用之前和之后检查系统内存使用情况。