有几天我们正在处理非常奇怪的问题。
我无法理解它是如何发生的 - 当第三方(MATLAB)程序使用我们的共享库时,它以某种方式覆盖了我们自己的一些符号(提升,准确)。这些符号是静态链接的,并且(!!)是本地的。
这是交易 - 我们使用boost 1.47,MATLAB提升1.40。目前,库在从OUR库调用它们的boost(regex)时调用segfaults。
所以,这就是魔术:
linux-vdso.so.1 => (0x00007fff4abff000) libpthread.so.0 => /lib/libpthread.so.0 (0x00007f1a3fd65000) libstdc++.so.6 => /usr/lib/libstdc++.so.6 (0x00007f1a3fa51000) libm.so.6 => /lib/libm.so.6 (0x00007f1a3f7cd000) libgomp.so.1 => /usr/lib/libgomp.so.1 (0x00007f1a3f5bf000) libgcc_s.so.1 => /lib/libgcc_s.so.1 (0x00007f1a3f3a8000) libc.so.6 => /lib/libc.so.6 (0x00007f1a3f024000) /lib64/ld-linux-x86-64.so.2 (0x00007f1a414f9000) librt.so.1 => /lib/librt.so.1 (0x00007f1a3ee1c000)
nm -g --defined-only libmysharedlib.so addr1 T OurCSymbol1 addr2 T OurCSymbol2 addr3 T OurCSymbol3 ...
[ 0] 0x00007f21fddbb0a9 bin/libmwfl.so+00454825 fl::sysdep::linux::unwind_stack(void const**, unsigned long, unsigned long, fl::diag::thread_context const&)+000009 [ 1] 0x00007f21fdd74111 bin/glnxa64/libmwfl.so+00164113 fl::diag::stacktrace_base::capture(fl::diag::thread_context const&, unsigned long)+000161 [ 2] 0x00007f21fdd7d42d bin/glnxa64/libmwfl.so+00201773 [ 3] 0x00007f21fdd7d6b4 bin/glnxa64/libmwfl.so+00202420 fl::diag::terminate_log(char const*, fl::diag::thread_context const&, bool)+000100 [ 4] 0x00007f21fce525a7 bin/glnxa64/libmwmcr.so+00365991 [ 5] 0x00007f21fb9eb8f0 lib/libpthread.so.0+00063728 [ 6] 0x00007f21f3e939a9 libboost_regex.so.1.40.0+00342441 boost::re_detail::perl_matcher, std::allocator > >, boost::regex_traits > >::match_all_states()+000073 [ 7] 0x00007f21f3eb6546 bin/glnxa64/libboost_regex.so.1.40.0+00484678 boost::re_detail::perl_matcher, std::allocator > >, boost::regex_traits > >::match_imp()+000758 [ 8] 0x00007f21c04ad595 lib/libmysharedlib.so+04855189 bool boost::regex_match, std::allocator > >, char, boost::regex_traits > >(__gnu_cxx::__normal_iterator, __gnu_cxx::__normal_iterator, boost::match_results, std::allocator > > >&, boost::basic_regex > > const&, boost::regex_constants::_match_flags)+000245 [ 9] 0x00007f21c04a71c7 lib/libmysharedlib.so+04829639 myfunc2()+000183 [ 10] 0x00007f21c01b41e3 lib/libmysharedlib.so+01737187 myfunc1()+000307
众所周知,MATLAB仅使用RTLD_NOW标志进行dlopen。
人们,请和我一起思考。 现在我迫不及待解决这个问题,而只是简单地理解ld& elf行为。
编辑: 小的附加问题:我如何理解,没有特殊的链接器选项,linux中的符号.so库永远不会被地址链接?那么即使是静态链接的本地符号也会在运行时解决?
答案 0 :(得分:5)
查看 ld 的-Bsymbolic
选项。
如果指定了-Bsymbolic
,则在创建共享时
object ld 将尝试将对全局符号的引用绑定到定义
在共享库中。默认设置是将绑定推迟到运行时。
这可能更清楚一个例子。
Say example.o
包含对定义的全局函数的引用
global.o
,
$ nm example.o | grep ' U'
U _GLOBAL_OFFSET_TABLE_
U globalfn
$ nm global.o | grep ' T'
00000000 T globalfn
和两个共享对象normal.so
和symbolic.so
构建为
如下:
$ cc -fPIC -c example.c
$ cc -c global.c
$ rm -f archive.a; ar cr archive.a global.o
$ ld -shared -o normal.so example.o archive.a
$ ld -Bsymbolic -shared -o symbolic.so example.o archive.a
反汇编代码normal.so
显示调用了
globalfn
实际上正在通过过程链接表,并且
因此,调用的最终目的地是在运行时确定的。
$ objdump --disassemble normal.so
...snip...
00000194 <example>:
...snip...
1a6: e8 d9 ff ff ff call 184 <globalfn@plt>
...snip...
$ readelf -r normal.so
Relocation section '.rel.plt' at offset 0x16c contains 1 entries:
Offset Info Type Sym.Value Sym. Name
00001244 00000207 R_386_JUMP_SLOT 000001b8 globalfn
而在symbolic.so
中,调用总是调用的定义
共享对象中的globalfn
。
$ objdump --disassemble symbolic.so
...snip...
0000016c <shared>:
...snip...
17e: e8 0d 00 00 00 call 190 <globalfn>
...snip...
$ readelf -r symbolic.so
There are no relocations in this file.
答案 1 :(得分:3)
这是交易 - 我们使用boost 1.47,MATLAB提升1.40。目前,库在从OUR库调用它们的boost(regex)时调用segfaults。
你正在调用未定义的行为,这是一种“博士,当我这样做时会受到伤害”的情况。 Matlab可执行文件已包含类boost::re_detail::perl_matcher< elided >
的外部函数。当Matlab加载您的共享库时,动态链接器会看到您的共享库以与现有定义冲突的方式定义那些完全相同的符号。未定义的行为。
解决方案是构建一个与Matlab一起使用的库版本,它使用与Matlab相同版本的Boost。