用GCC 4.5崩溃编译的程序,而GCC 4.4很好

时间:2011-06-09 13:54:31

标签: c++ gcc tcl simulator

最近我尝试编译并安装ns-2,一个基于C ++和Tcl的网络模拟器。

使用一些略微修改的源代码(不用担心,它不会导致崩溃),我可以使用最新的gcc 4.5版本进行编译。

但是当我执行二进制文件时,它会给出以下错误。:

$bin/ns
*** buffer overflow detected ***: bin/ns terminated

相同代码如果使用早期gcc编译 运行正常。所以我认为这是由于 gcc 4.5 中的一些enhanced features

如何解决此问题?当然使用 gcc 4.4 进行编译是一种选择,但我想知道出了什么问题:)

更新

这是使用gdb的完整堆栈跟踪和后跟踪:

$ bin/ns
*** buffer overflow detected ***: bin/ns terminated
======= Backtrace: =========
/lib/x86_64-linux-gnu/libc.so.6(__fortify_fail+0x37)[0x7f01824ac1d7]
/lib/x86_64-linux-gnu/libc.so.6(+0xfd0f0)[0x7f01824ab0f0]
bin/ns[0x8d5b5a]
bin/ns[0x8d56de]
bin/ns[0x841077]
bin/ns[0x842b19]
bin/ns(Tcl_EvalEx+0x16)[0x843256]
bin/ns(Tcl_Eval+0x1d)[0x84327d]
bin/ns(Tcl_GlobalEval+0x2b)[0x84391b]
bin/ns(_ZN3Tcl4evalEPc+0x27)[0x83352b]
bin/ns(_ZN3Tcl5evalcEPKc+0xdd)[0x8334e9]
bin/ns(_ZN11EmbeddedTcl4loadEv+0x24)[0x834712]
bin/ns(Tcl_AppInit+0xb2)[0x8331a5]
bin/ns(Tcl_Main+0x1d0)[0x8ad6a0]
bin/ns(nslibmain+0x25)[0x8330c5]
bin/ns(main+0x20)[0x833254]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xff)[0x7f01823cceff]
bin/ns[0x5bc1a9]

使用GDB并打开符号:

(gdb) bt
#0  0x00007ffff6970d05 in raise () from /lib/x86_64-linux-gnu/libc.so.6
#1  0x00007ffff6974ab6 in abort () from /lib/x86_64-linux-gnu/libc.so.6
#2  0x00007ffff69a9d7b in ?? () from /lib/x86_64-linux-gnu/libc.so.6
#3  0x00007ffff6a3b1d7 in __fortify_fail () from /lib/x86_64-linux-gnu/libc.so.6
#4  0x00007ffff6a3a0f0 in __chk_fail () from /lib/x86_64-linux-gnu/libc.so.6
#5  0x00000000008d5b5a in strcpy (interp=0xd2dda0, optionIndex=<value optimized out>, objc=<value optimized out>, objv=0x7fffffffdad0)
    at /usr/include/bits/string3.h:105
#6  TraceVariableObjCmd (interp=0xd2dda0, optionIndex=<value optimized out>, objc=<value optimized out>, objv=0x7fffffffdad0)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclTrace.c:912
#7  0x00000000008d56de in Tcl_TraceObjCmd (dummy=<value optimized out>, interp=0xd2dda0, objc=<value optimized out>, objv=0xd2ec00)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclTrace.c:293
#8  0x0000000000841077 in TclEvalObjvInternal (interp=0xd2dda0, objc=5, objv=0xd2ec00,
    command=0x7ffff7f680fe "trace variable defaultRNG w { abort \"cannot update defaultRNG once assigned\"; }\n\n\nClass RandomVariable/TraceDriven -superclass RandomVariable\n\nRandomVariable/TraceDriven instproc init {} {\n$self instv"..., length=80, flags=0)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclBasic.c:3689
#9  0x0000000000842b19 in TclEvalEx (interp=0xd2dda0,
    script=0x7ffff7f52010 "\n\n\n\n\n\nproc warn {msg} {\nglobal warned_\nif {![info exists warned_($msg)]} {\nputs stderr \"warning: $msg\"\nset warned_($msg) 1\n}\n}\n\nif {[info commands debug] == \"\"} {\nproc debug args {\nwarn {Script debugg"..., numBytes=422209, flags=<value optimized out>, line=4141,
    clNextOuter=<value optimized out>,
    outerScript=0x7ffff7f52010 "\n\n\n\n\n\nproc warn {msg} {\nglobal warned_\nif {![info exists warned_($msg)]} {\nputs stderr \"warning: $msg\"\nset warned_($msg) 1\n}\n}\n\nif {[info commands debug] == \"\"} {\nproc debug args {\nwarn {Script debugg"...)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclBasic.c:4386
#10 0x0000000000843256 in Tcl_EvalEx (interp=<value optimized out>, script=<value optimized out>, numBytes=<value optimized out>,
    flags=<value optimized out>) at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclBasic.c:4043
#11 0x000000000084327d in Tcl_Eval (interp=0xd2dda0, script=<value optimized out>)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclBasic.c:4955
#12 0x000000000084391b in Tcl_GlobalEval (interp=0xd2dda0, command=<value optimized out>)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclBasic.c:6005
#13 0x000000000083352b in Tcl::eval(char*) ()
#14 0x00000000008334e9 in Tcl::evalc(char const*) ()
#15 0x0000000000834712 in EmbeddedTcl::load() ()
#16 0x00000000008331a5 in Tcl_AppInit ()
#17 0x00000000008ad6a0 in Tcl_Main (argc=<value optimized out>, argv=0x7fffffffe1d0, appInitProc=0x8330f3 <Tcl_AppInit>)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclMain.c:418
#18 0x00000000008330c5 in nslibmain ()
#19 0x0000000000833254 in main ()    

3 个答案:

答案 0 :(得分:6)

着名的遗言:“别担心 - 我的改变没有破坏任何东西”。我们怎么能确定呢?

但是,如果代码在4.4下运行并且在4.5以下崩溃,那么你有可能是正确的。

GCC采用了一些与代码相关的积极优化,试图检测整数溢出并将其删除。在这种情况下,您将不得不在ns-2中找到该代码,并尝试通过ns-2开发人员或您自己修复它。

您应该尝试在调试器下运行程序,以便在检测到缓冲区溢出的位置获得控制权,并查看代码的位置。如果您禁用了核心转储(使用ulimit -c 0或等效项),请考虑启用它们,并查看是否在终止时获得核心转储。这应该给你一个起点。


进一步的想法:

  • 编译代码时,使用警告标志的严格程度如何?你可以重新编译并启用更多警告吗?

    如果您无法找到其他方法来获取C或C ++编译器的特殊选项,那么通常可以使用的一种技术(使用AutoTools配置的程序):

    ./configure --prefix=/opt/ns CC="gcc -Wall -Wextra" CXX="g++ -Wall -Wextra"
    

    (我还使用此技术指定32位与64位版本,添加-m32-m64。)

    警告:如果在这些选项下没有创建代码来编译干净,那么使用这些选项进行第一次编译可能会带来创伤。但是,在所有警告中,还有一个很好的机会是关于问题根源的警告。然而,无可争议的是,任何1(或更糟)的警告可能会有50个与之无关的警告,并且修复因此发现的所有警告仍然可能无法解决问题。如果代码无论如何都会编写严格的警告,那么您将面临启用更多异国情调警告的问题。但是如果你能让编译器帮助诊断它所引起的问题,你当然应该这样做 - 它比独立找到问题简单得多。

  • 此外,请确保您正在制作可调试程序 - 即使您已启用优化。

  • 另外,考虑编译优化关闭并查看程序是否仍然崩溃。如果程序在没有优化的情况下没有崩溃并且优化,那么您将获得一些有用的信息。它不会更容易找到原因,但你知道它(可能)与优化器相关。或者可能只是在没有优化时错误移动并且不会致命地失败。


扩展堆栈跟踪信息很奇怪:

#5  0x00000000008d5b5a in strcpy (interp=0xd2dda0, optionIndex=<value optimized out>,
                                  objc=<value optimized out>, objv=0x7fffffffdad0)
    at /usr/include/bits/string3.h:105
#6  TraceVariableObjCmd (interp=0xd2dda0, optionIndex=<value optimized out>,
                         objc=<value optimized out>, objv=0x7fffffffdad0)
    at /media/Linux/ns-allinone-2.35-RC7/tcl8.5.8/unix/../generic/tclTrace.c:912

这些不是strcpy()的普通论据。通常,您只有两个参数。我不能立即想到一个适合将字符串复制到指向Tcl解释器主控制结构的指针的情况。所以,为了更进一步,我会非常认真地看待tclTrace.c中的第900-920行,特别是第912行。这可能只是优化器挖掘对象的方式的假象代码,或者它可能是一个真正的问题。

我发现tcl8.5.8源代码和tclTrace.c的第912行是此代码中的strcpy()

    if ((enum traceOptions) optionIndex == TRACE_ADD) {
        CombinedTraceVarInfo *ctvarPtr;

        ctvarPtr = (CombinedTraceVarInfo *) ckalloc((unsigned)
                (sizeof(CombinedTraceVarInfo) + length + 1
                - sizeof(ctvarPtr->traceCmdInfo.command)));
        ctvarPtr->traceCmdInfo.flags = flags;
        if (objv[0] == NULL) {
            ctvarPtr->traceCmdInfo.flags |= TCL_TRACE_OLD_STYLE;
        }
        ctvarPtr->traceCmdInfo.length = length;
        flags |= TCL_TRACE_UNSETS | TCL_TRACE_RESULT_OBJECT;
        strcpy(ctvarPtr->traceCmdInfo.command, command);       // Line 912
        ctvarPtr->traceInfo.traceProc = TraceVarProc;
        ctvarPtr->traceInfo.clientData = (ClientData)
                &ctvarPtr->traceCmdInfo;
        ctvarPtr->traceInfo.flags = flags;
        name = Tcl_GetString(objv[3]);
        if (TraceVarEx(interp,name,NULL,(VarTrace*)ctvarPtr) != TCL_OK) {
            ckfree((char *) ctvarPtr);
            return TCL_ERROR;
        }
    } else {

因此,GDB的输出和堆栈跟踪看起来有些误导;有两个变量传递给strcpy(),其中一个变量在堆上本地分配。

我会考虑从嵌入tcl的源代码中独立编译ns-2,看看你是否可以自己搔痒这个bug(抱歉,可怕的双关语)。此代码与跟踪tcl变量 - trace add varname ... AFAICT。

相关

假设通过,我会考虑获取GCC 4.6并查看使用它而不是GCC 4.5编译ns-2时是否会出现同样的问题。


Valgrind的

由于您在Linux上运行,因此您应该可以使用Valgrind。它非常适合发现内存滥用问题。为了获得最大收益,请使用ns-2的调试版本。

答案 1 :(得分:2)

“检测到缓冲区溢出”:您正在写入未分配的区域。 gcc 4.4显然生成的代码没有触发问题(或者有一个问题没有显示为崩溃但是现在却没有检测到错误的结果),gcc 4.5生成代码来检测问题并警告你。唯一的解决方案是找到问题的根源并修复代码。

答案 2 :(得分:1)

这可能是各种各样的事情。这可能是一个GCC错误。它可能是一个Tcl错误(我希望它不是,作为Tcl开发人员之一发言,但我不会排除它,因为Tcl经常假设结构上没有保护代码; Tcl 肯定< / em> C89代码)。它可能是ns2中的一个错误。据我所知,它甚至可能是其他地方的错误(因为ns2是基于Tcl构建的,它可以加载外部代码库;很可能在那里遇到问题)。

唉,我们无法从所发布的信息中看出它是哪种可能性。你知道程序崩溃时callstack在哪个库中吗?虽然不能保证这是问题的实际位置,但它至少是一个开始寻找漏洞的地方......