堆栈分配给线程

时间:2011-07-21 00:12:41

标签: c linux stack pthreads

我一直试图将堆栈内存分配给线程。我无法把整个事情拼凑起来。我试着去看代码,但我更困惑,所以我要求你的帮助。

不久前我asked this question。因此假设特定程序(因此,所有线程都在同一个进程中)。如果我为堆栈指针的每个开头写printf,然后为它们分配了多少,那么我会收到类似于此消息末尾的表的内容,其中第一列是time_t usec ,第二个没关系,第三个是线程的tid,第四个是保护大小,然后是堆栈的开始,堆栈的结束(按堆栈的开头排序),最后一个是分配的堆栈(8 Megs)默认情况下),最后一列是第一个分配堆栈结束与下一个堆栈开始之间的差异。

这意味着(我认为),如果为0,那么堆栈是连续的,如果是正的,因为堆栈在内存中增长,那么这意味着在tid和tid之间存在多个Mbs的“自由空间”下一个(在记忆中)。如果是否定的,这意味着内存正在被重用。所以这可能意味着在创建此线程之前已经释放了堆栈空间。

我的问题是:为线程分配堆栈空间的算法究竟是什么(比代码更高的层次),为什么我有时会得到连续的堆栈,有时候不会,有时会得到像7.94140625和0.0625这样的值列?

这是所有Linux 2.6,C和pthreads。

这可能是我们必须重复以使其正确的问题,为此我道歉,但我告诉你我现在所知道的。随意请求澄清。

谢谢你。表格如下。

52815   14  14786   4096    92549120    100941824   8392704 0
52481   14  14784   4096    100941824   109334528   8392704 0
51700   14  14777   4096    109334528   117727232   8392704 0
70747   14  14806   4096    117727232   126119936   8392704 8.00390625
75813   14  14824   4096    117727232   126119936   8392704 0
51464   14  14776   4096    126119936   134512640   8392704 8.00390625
76679   14  14833   4096    126119936   134512640   8392704 -4.51953125
53799   14  14791   4096    139251712   147644416   8392704 -4.90234375
52708   14  14785   4096    152784896   161177600   8392704 0
50912   14  14773   4096    161177600   169570304   8392704 0
51617   14  14775   4096    169570304   177963008   8392704 0
70028   14  14793   4096    177963008   186355712   8392704 0
51048   14  14774   4096    186355712   194748416   8392704 0
50596   14  14771   4096    194748416   203141120   8392704 8.00390625

2 个答案:

答案 0 :(得分:8)

首先,通过展示启动单个线程的简单测试程序,我们可以看到它用于创建新线程的系统调用。这是一个简单的测试程序:

#include <pthread.h>
#include <stdio.h>

void *test(void *x) { }

int main() {
        pthread_t thr;
        printf("start\n");
        pthread_create(&thr, NULL, test, NULL);
        pthread_join(thr, NULL);
        printf("end\n");
        return 0;
}

其strace输出的相关部分:

write(1, "start\n", 6start
)                  = 6
mmap2(NULL, 8392704, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS|MAP_STACK, -1, 0) = 0xf6e32000
brk(0)                                  = 0x8915000
brk(0x8936000)                          = 0x8936000
mprotect(0xf6e32000, 4096, PROT_NONE)   = 0
clone(child_stack=0xf7632494, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0xf7632bd8, {entry_number:12, base_addr:0xf7632b70, limit:1048575, seg_32bit:1, contents:0, read_exec_only:0, limit_in_pages:1, seg_not_present:0, useable:1}, child_tidptr=0xf7632bd8) = 9181
futex(0xf7632bd8, FUTEX_WAIT, 9181, NULL) = -1 EAGAIN (Resource temporarily unavailable)
write(1, "end\n", 4end
)                    = 4
exit_group(0)                           = ?

我们可以看到它从mmap获得了一个带有PROT_READ|PROT_WRITE保护和MAP_PRIVATE|MAP_ANONYMOUS|MAP_STACK标志的堆栈。然后它保护堆栈的第一个(即最低)页面,以检测堆栈溢出。其余的电话与手头的讨论并不相关。

那么,mmap如何分配堆栈呢?好吧,让我们从Linux内核的mmap_pgoff开始吧;现代mmap2系统调用的入口点。它在锁定后委托给do_mmap_pgoff。然后调用get_unmapped_area来查找适当范围的未映射页面。

不幸的是,这会调用vma中定义的函数指针 - 这可能是因为32位和64位进程可以对不同的地址进行映射。在x86的情况下,这是在arch_pick_mmap_layout中定义的,它根据它是否使用32位或64位架构进行切换。

那么让我们看一下arch_get_unmapped_area的实现。它首先从find_start_end获取一些合理的默认值,然后测试以查看传入的地址提示是否有效(对于线程堆栈,没有传递提示)。然后它开始扫描虚拟内存映射,从缓存的地址开始,直到找到一个洞。它保存了孔的末端以供下次搜索使用,然后返回该孔的位置。如果它到达地址空间的末尾,它会从一开始就再次启动,再给它一次机会找到一个开放区域。

正如您所看到的,通常情况下,它将以递增的方式分配堆栈(对于x86; x86-64使用arch_get_unmapped_area_topdown并且可能会将它们分配为递减)。但是,它还会保留从何处开始搜索的缓存,因此可能会留下空白,具体取决于区域的释放时间。特别是,当释放一个mmaped区域时,它可能会更新free-address-search-cache,因此你可能会看到那里的乱序分配。

那就是说,这都是一个实现细节。 不要在程序中依赖任何此类。只需拿出mmap的地址即可,并感到高兴:)

答案 1 :(得分:4)

glibc在nptl/allocatestack.c中处理此问题。

关键是:

mem = mmap (NULL, size, prot,
            MAP_PRIVATE | MAP_ANONYMOUS | MAP_STACK, -1, 0);

所以它只是要求内核提供一些匿名内存,与malloc对大块的内存不同。它实际上得到的块取决于内核......