我遇到了一个奇怪的情况,它将一个指针传递给一个结构,该结构在struct {}定义中定义了一个非常大的数组,一个大小为34MB的浮点数组。简而言之,伪代码看起来像这样:
typedef config_t{
...
float values[64000][64];
} CONFIG;
int32_t Create_Structures(CONFIG **the_config)
{
CONFIG *local_config;
int32_t number_nodes;
number_nodes = Find_Nodes();
local_config = (CONFIG *)calloc(number_nodes,sizeof(CONFIG));
*the_config = local_config;
return(number_nodes);
}
int32_t Read_Config_File(CONFIG *the_config)
{
/* do init work here */
return(SUCCESS);
}
main()
{
CONFIG *the_config;
int32_t number_nodes,rc;
number_nodes = Create_Structures(&the_config);
rc = Read_Config_File(the_config);
...
exit(0);
}
代码编译得很好,但是当我尝试运行它时,我会在{Read_Config_File()下面得到一个SIGSEGV。
(gdb) run
...
Program received signal SIGSEGV, Segmentation fault.
0x0000000000407d0a in Read_Config_File (the_config=Cannot access memory at address 0x7ffffdf45428
) at ../src/config_parsing.c:763
763 {
(gdb) bt
#0 0x0000000000407d0a in Read_Config_File (the_config=Cannot access memory at address 0x7ffffdf45428
) at ../src/config_parsing.c:763
#1 0x00000000004068d2 in main (argc=1, argv=0x7fffffffe448) at ../src/main.c:148
我一直在做这种事情,使用较小的数组。奇怪的是,0x7fffffffe448 - 0x7ffffdf45428 = 0x20B8EF8,或大约34MB的浮点数组。
Valgrind会给我类似的输出:
==10894== Warning: client switching stacks? SP change: 0x7ff000290 --> 0x7fcf47398
==10894== to suppress, use: --max-stackframe=34311928 or greater
==10894== Invalid write of size 8
==10894== at 0x407D0A: Read_Config_File (config_parsing.c:763)
==10894== by 0x4068D1: main (main.c:148)
==10894== Address 0x7fcf47398 is on thread 1's stack
错误消息都指向我破坏堆栈指针,但是a)我从未遇到过在函数入口处崩溃的错误消息和b)我正在传递指针,而不是实际的数组。
有人可以帮我解决这个问题吗?我在运行内核2.6.18和gcc 4.1.2
的64位CentOS机器上谢谢!
马特
答案 0 :(得分:1)
简短的回答是必须在某处将config_t
声明为局部变量,这会将其置于堆栈中。可能是一个拼写错误:在某处的CONFIG声明后丢失*
。
答案 1 :(得分:1)
你通过将一个巨大的config_t结构分配到它上来炸毁堆栈。 gdb输出中的两个堆栈指针0x7ffffff448和0x7ffffdf45428非常暗示这一点。
$ gdb
GNU gdb 6.3.50-20050815 ...blahblahblah...
(gdb) p 0x7fffffffe448 - 0x7ffffdf45428
$1 = 34312224
你的~34MB常量与config_t结构的大小相匹配。默认情况下,系统不会为您提供那么多的堆栈空间,因此要么将对象移出堆栈,要么增加堆栈空间。