下面的代码只创建两个线程并尝试获取它们的返回值。
我已经在32位glibc-2.15系统上编译并运行它,一切顺利(输出:r1:1,r2:2)。但是当我在64位glibc-2.17系统上做同样的事情时,输出错误(输出:r1:0,r2:2)。为什么相同的代码在不同的系统上表现不同?
注意:如果r1和r2的类型更改为void*
或int*
,如下所示,则代码适用于两个系统。
#include <stdio.h>
#include <pthread.h>
#include <unistd.h>
#include <string.h>
void* worker(void* arg) {
int i = (int) arg;
pthread_exit((void*)i);
}
int main(int argc, char** argv) {
pthread_t tid[2];
int err = 0;
err = pthread_create(&tid[0], NULL, worker, (void*) 1);
if(err != 0) printf("error: %s\n", strerror(err));
err = pthread_create(&tid[1], NULL, worker, (void*) 2);
if(err != 0) printf("error: %s\n", strerror(err));
///*
int r1 = 0, r2 = 0; // <-- WRONG: r1: 0, r2: 2
//void *r1, *r2; // <-- OK: r1: 1, r2: 2
pthread_join(tid[0], (void**) &r1);
pthread_join(tid[1], (void**) &r2);
printf("r1: %d, r2: %d\n", (int) r1, (int) r2);
//*/
// make comment above snippet and uncomment below snippet: // <-- OK: r1: 1, r2: 2
/*
int *r1 = (int*) malloc(sizeof(int));
int *r2 = (int*) malloc(sizeof(int));
pthread_join(tid[0], (void**) r1);
pthread_join(tid[1], (void**) r2);
printf("r1: %d, r2: %d\n", (int)(*r1), (int)(*r2));
*/
return 0;
}
答案 0 :(得分:1)
简短回答:在64位系统sizeof(void*) != sizeof(int)
上,并通过将&int
传递给pthread_join
,您正在调用未定义的行为(并破坏堆栈;运行该程序的变体地址Sanitizer应检测错误。)
如果您传递&int
,但int
是堆分配的,那么您正在破坏堆,但您还没有注意到(您的程序可能会在以后崩溃)后续malloc
或free
)。在Valgrind或Address Sanitizer下运行该程序的变体应该可以简单地证明堆腐败。
更长的答案:pthread_join(tid, &x)
基本上执行此操作:
memcpy(&x, previosly_used_pthread_exit_value, sizeof(void*));
现在应该清楚的是传递sizeof(x) < sizeof(void*)
调用未定义行为的任何变量的地址。