我一直试图将堆栈内存分配给线程。我无法把整个事情拼凑起来。我试着去看代码,但我更困惑,所以我要求你的帮助。
不久前我asked this question。因此假设特定程序(因此,所有线程都在同一个进程中)。如果我为堆栈指针的每个开头写printf
,然后为它们分配了多少,那么我会收到类似于此消息末尾的表的内容,其中第一列是time_t usec
,第二个没关系,第三个是线程的tid,第四个是保护大小,然后是堆栈的开始,堆栈的结束(按堆栈的开头排序),最后一个是分配的堆栈(8 Megs)默认情况下),最后一列是第一个分配堆栈结束与下一个堆栈开始之间的差异。
这意味着(我认为),如果为0,那么堆栈是连续的,如果是正的,因为堆栈在内存中增长,那么这意味着在tid和tid之间存在多个Mbs的“自由空间”下一个(在记忆中)。如果是否定的,这意味着内存正在被重用。所以这可能意味着在创建此线程之前已经释放了堆栈空间。
我的问题是:为线程分配堆栈空间的算法究竟是什么(比代码更高的层次),为什么我有时会得到连续的堆栈,有时候不会,有时会得到像7.94140625和0.0625这样的值列?
这是所有Linux 2.6,C和pthreads。
这可能是我们必须重复以使其正确的问题,为此我道歉,但我告诉你我现在所知道的。随意请求澄清。
谢谢你。表格如下。
52815 14 14786 4096 92549120 100941824 8392704 0
52481 14 14784 4096 100941824 109334528 8392704 0
51700 14 14777 4096 109334528 117727232 8392704 0
70747 14 14806 4096 117727232 126119936 8392704 8.00390625
75813 14 14824 4096 117727232 126119936 8392704 0
51464 14 14776 4096 126119936 134512640 8392704 8.00390625
76679 14 14833 4096 126119936 134512640 8392704 -4.51953125
53799 14 14791 4096 139251712 147644416 8392704 -4.90234375
52708 14 14785 4096 152784896 161177600 8392704 0
50912 14 14773 4096 161177600 169570304 8392704 0
51617 14 14775 4096 169570304 177963008 8392704 0
70028 14 14793 4096 177963008 186355712 8392704 0
51048 14 14774 4096 186355712 194748416 8392704 0
50596 14 14771 4096 194748416 203141120 8392704 8.00390625
答案 0 :(得分:8)
首先,通过展示启动单个线程的简单测试程序,我们可以看到它用于创建新线程的系统调用。这是一个简单的测试程序:
#include <pthread.h>
#include <stdio.h>
void *test(void *x) { }
int main() {
pthread_t thr;
printf("start\n");
pthread_create(&thr, NULL, test, NULL);
pthread_join(thr, NULL);
printf("end\n");
return 0;
}
其strace输出的相关部分:
write(1, "start\n", 6start
) = 6
mmap2(NULL, 8392704, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS|MAP_STACK, -1, 0) = 0xf6e32000
brk(0) = 0x8915000
brk(0x8936000) = 0x8936000
mprotect(0xf6e32000, 4096, PROT_NONE) = 0
clone(child_stack=0xf7632494, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0xf7632bd8, {entry_number:12, base_addr:0xf7632b70, limit:1048575, seg_32bit:1, contents:0, read_exec_only:0, limit_in_pages:1, seg_not_present:0, useable:1}, child_tidptr=0xf7632bd8) = 9181
futex(0xf7632bd8, FUTEX_WAIT, 9181, NULL) = -1 EAGAIN (Resource temporarily unavailable)
write(1, "end\n", 4end
) = 4
exit_group(0) = ?
我们可以看到它从mmap获得了一个带有PROT_READ|PROT_WRITE
保护和MAP_PRIVATE|MAP_ANONYMOUS|MAP_STACK
标志的堆栈。然后它保护堆栈的第一个(即最低)页面,以检测堆栈溢出。其余的电话与手头的讨论并不相关。
mmap
如何分配堆栈呢?好吧,让我们从Linux内核的mmap_pgoff
开始吧;现代mmap2
系统调用的入口点。它在锁定后委托给do_mmap_pgoff
。然后调用get_unmapped_area
来查找适当范围的未映射页面。
不幸的是,这会调用vma中定义的函数指针 - 这可能是因为32位和64位进程可以对不同的地址进行映射。在x86的情况下,这是在arch_pick_mmap_layout
中定义的,它根据它是否使用32位或64位架构进行切换。
那么让我们看一下arch_get_unmapped_area
的实现。它首先从find_start_end
获取一些合理的默认值,然后测试以查看传入的地址提示是否有效(对于线程堆栈,没有传递提示)。然后它开始扫描虚拟内存映射,从缓存的地址开始,直到找到一个洞。它保存了孔的末端以供下次搜索使用,然后返回该孔的位置。如果它到达地址空间的末尾,它会从一开始就再次启动,再给它一次机会找到一个开放区域。
正如您所看到的,通常情况下,它将以递增的方式分配堆栈(对于x86; x86-64使用arch_get_unmapped_area_topdown
并且可能会将它们分配为递减)。但是,它还会保留从何处开始搜索的缓存,因此可能会留下空白,具体取决于区域的释放时间。特别是,当释放一个mmaped区域时,它可能会更新free-address-search-cache,因此你可能会看到那里的乱序分配。
那就是说,这都是一个实现细节。 不要在程序中依赖任何此类。只需拿出mmap
的地址即可,并感到高兴:)
答案 1 :(得分:4)
glibc在nptl/allocatestack.c中处理此问题。
关键是:
mem = mmap (NULL, size, prot,
MAP_PRIVATE | MAP_ANONYMOUS | MAP_STACK, -1, 0);
所以它只是要求内核提供一些匿名内存,与malloc
对大块的内存不同。它实际上得到的块取决于内核......