dlopen malloc僵局

时间:2012-08-14 14:28:29

标签: c malloc deadlock dlopen

我们有一些经常陷入僵局的单元测试。使用GDB进行更密切的检查显示以下内容:

主题1:

(gdb) bt
#0  0x00110424 in __kernel_vsyscall ()
#1  0x00c681a3 in __lll_lock_wait_private () from /lib/libc.so.6
#2  0x00bf09fb in _L_lock_515 () from /lib/libc.so.6
#3  0x00bf068c in tr_mallochook () from /lib/libc.so.6
#4  0x00bece22 in calloc () from /lib/libc.so.6
#5  0x00b5ed93 in _dl_new_object () from /lib/ld-linux.so.2
#6  0x00b5b287 in _dl_map_object_from_fd () from /lib/ld-linux.so.2
#7  0x00b5c521 in _dl_map_object () from /lib/ld-linux.so.2
#8  0x00b66f43 in dl_open_worker () from /lib/ld-linux.so.2
#9  0x00b629a6 in _dl_catch_error () from /lib/ld-linux.so.2
#10 0x00b66a06 in _dl_open () from /lib/ld-linux.so.2
#11 0x00d38c3b in dlopen_doit () from /lib/libdl.so.2
#12 0x00b629a6 in _dl_catch_error () from /lib/ld-linux.so.2
#13 0x00d3903c in _dlerror_run () from /lib/libdl.so.2
#14 0x00d38b71 in dlopen@@GLIBC_2.1 () from /lib/libdl.so.2
...

主题2:

#0  0x00110424 in __kernel_vsyscall ()
#1  0x00d4c059 in __lll_lock_wait () from /lib/libpthread.so.0
#2  0x00d4740e in _L_lock_752 () from /lib/libpthread.so.0
#3  0x00d4731a in pthread_mutex_lock () from /lib/libpthread.so.0
#4  0x00c95dd2 in _dl_addr () from /lib/libc.so.6
#5  0x00bf0425 in tr_where () from /lib/libc.so.6
#6  0x00bf06bd in tr_mallochook () from /lib/libc.so.6
#7  0x00bed01b in malloc () from /lib/libc.so.6
....

我在互联网上做了很多搜索,但我无法确定我是否做错了,或者我是否在库中发现了错误。

1 个答案:

答案 0 :(得分:5)

glibc的dlopen()代码似乎不是线程安全的。

您的代码看起来像是从两个线程同时调用malloc()dlopen()。它看起来像malloc()调用命中未解析的动态符号并尝试使用_dl_addr()解析它,这意味着您正在执行的二进制文件与延迟绑定(默认ld行为)和这就是运行时链接器在第一次调用时根据需要解析符号的原因。尝试将其与-Wl,-z,now gcc链接器选项链接,以使运行时链接程序在启动应用程序之前解析所有符号。

此错误与我提交bug report的错误类似。