奇怪的堆栈溢出?

时间:2012-01-19 23:43:00

标签: c pointers stack-overflow

我遇到了一个奇怪的情况,它将一个指针传递给一个结构,该结构在struct {}定义中定义了一个非常大的数组,一个大小为34MB的浮点数组。简而言之,伪代码看起来像这样:

typedef config_t{
  ...
  float values[64000][64];
} CONFIG;


int32_t Create_Structures(CONFIG **the_config)
{
  CONFIG  *local_config;
  int32_t number_nodes;

  number_nodes = Find_Nodes();

  local_config = (CONFIG *)calloc(number_nodes,sizeof(CONFIG));
  *the_config = local_config;
  return(number_nodes);
}


int32_t Read_Config_File(CONFIG *the_config)
{
    /* do init work here */
    return(SUCCESS);
}


main()
{
    CONFIG *the_config;
    int32_t number_nodes,rc;

    number_nodes = Create_Structures(&the_config);

    rc = Read_Config_File(the_config);
    ...
    exit(0);
}

代码编译得很好,但是当我尝试运行它时,我会在{Read_Config_File()下面得到一个SIGSEGV。

(gdb) run
...
Program received signal SIGSEGV, Segmentation fault.
0x0000000000407d0a in Read_Config_File (the_config=Cannot access memory at address 0x7ffffdf45428
) at ../src/config_parsing.c:763
763 {
(gdb) bt
#0  0x0000000000407d0a in Read_Config_File (the_config=Cannot access memory at address 0x7ffffdf45428
) at ../src/config_parsing.c:763
#1  0x00000000004068d2 in main (argc=1, argv=0x7fffffffe448) at ../src/main.c:148

我一直在做这种事情,使用较小的数组。奇怪的是,0x7fffffffe448 - 0x7ffffdf45428 = 0x20B8EF8,或大约34MB的浮点数组。

Valgrind会给我类似的输出:

==10894== Warning: client switching stacks?  SP change: 0x7ff000290 --> 0x7fcf47398
==10894==          to suppress, use: --max-stackframe=34311928 or greater
==10894== Invalid write of size 8
==10894==    at 0x407D0A: Read_Config_File (config_parsing.c:763)
==10894==    by 0x4068D1: main (main.c:148)
==10894==  Address 0x7fcf47398 is on thread 1's stack

错误消息都指向我破坏堆栈指针,但是a)我从未遇到过在函数入口处崩溃的错误消息和b)我正在传递指针,而不是实际的数组。

有人可以帮我解决这个问题吗?我在运行内核2.6.18和gcc 4.1.2

的64位CentOS机器上

谢谢!

马特

2 个答案:

答案 0 :(得分:1)

简短的回答是必须在某处将config_t声明为局部变量,这会将其置于堆栈中。可能是一个拼写错误:在某处的CONFIG声明后丢失*

答案 1 :(得分:1)

你通过将一个巨大的config_t结构分配到它上来炸毁堆栈。 gdb输出中的两个堆栈指针0x7ffffff448和0x7ffffdf45428非常暗示这一点。

$ gdb
GNU gdb 6.3.50-20050815 ...blahblahblah...
(gdb) p 0x7fffffffe448 - 0x7ffffdf45428  
$1 = 34312224

你的~34MB常量与config_t结构的大小相匹配。默认情况下,系统不会为您提供那么多的堆栈空间,因此要么将对象移出堆栈,要么增加堆栈空间。