SIGSEGV,(貌似)由printf引起

时间:2009-12-08 17:56:49

标签: c malloc printf sigsegv

首先,对任何交叉发布道歉。希望我不是在这里重复一个问题,但我无法在其他地方找到它(通过Google和Stack Overflow)。

这是错误的要点。如果我在代码中的任何位置拨打printfsprintffprintf,要显示浮动内容,我会收到SIGSEGV (EXC_BAD_ACCESS)错误。让我举个例子。

以下引发错误:

float f = 0.5f;
printf("%f\n",f);

此代码不会:

float f = 0.5f;
printf("%d\n",f);

我意识到那里有隐含的转换,但我并不关心。我无法理解为什么打印浮点数而不是打印整数会产生错误。

注意:部分代码使用malloc创建一些非常大的多维数组。但是,对于这些打印语句,这些数组以任何方式引用。以下是我如何声明这些数组的示例。

#define X_LEN 20
#define XDOT_LEN 20
#define THETA_LEN 20
#define THETADOT_LEN 20
#define NUM_STATES (X_LEN+1) * (XDOT_LEN+1) * (THETA_LEN+1) * (THETADOT_LEN+1)
#define NUM_ACTS 100

float *states = (float *)malloc(NUM_STATES * sizeof(float));
// as opposed to float states[NUM_STATES] (more memory effecient)


float **q = (float**)malloc(NUM_STATES * sizeof(float*));

for(int i=0; i < NUM_STATES; i++) {
    float *a = (float*)malloc(NUM_ACTS * sizeof(float));
    for(int j=0; j < NUM_ACTS; j++) {
        a[j] = 0.0f;
    }
    q[i] = a;
}

然后上面的printf语句出现在代码中。

我添加malloc内容的原因是因为根据我的理解,SIGSEGV与格式不正确的malloc调用有关。因此,如果数组初始化是造成问题的原因,我想知道:

  • 为什么?
  • 如何更改malloc代码以解决此问题?

我已经包含了OS X生成的崩溃日志,以防万一可以帮助任何人。

Process:         pole [5453]
Path:            {REDACTED}
Identifier:      pole
Version:         ??? (???)
Code Type:       X86-64 (Native)
Parent Process:  bash [5441]

Date/Time:       2009-12-08 11:38:38.358 -0600
OS Version:      Mac OS X 10.6.2 (10C540)
Report Version:  6

Interval Since Last Report:          130074 sec
Crashes Since Last Report:           68
Per-App Crashes Since Last Report:   63
Anonymous UUID:                      CA20CF15-8C46-4C85-A793-6C69F9F40140

Exception Type:  EXC_BAD_ACCESS (SIGSEGV)
Exception Codes: KERN_INVALID_ADDRESS at 0x0000000100074f3b
Crashed Thread:  0  Dispatch queue: com.apple.main-thread

Thread 0 Crashed:  Dispatch queue: com.apple.main-thread
0   libSystem.B.dylib               0x00007fff828d489e __Balloc_D2A + 164
1   libSystem.B.dylib               0x00007fff828d49b8 __d2b_D2A + 45
2   libSystem.B.dylib               0x00007fff828e8c74 __dtoa + 320
3   libSystem.B.dylib               0x00007fff828aa960 __vfprintf + 4980
4   libSystem.B.dylib               0x00007fff828ec7db vfprintf_l + 111
5   libSystem.B.dylib               0x00007fff828ec75e fprintf + 196
6   pole                            0x00000001000028b5 Balance::sarsa() + 187
7   pole                            0x0000000100002e54 main + 49
8   pole                            0x00000001000010a8 start + 52

Thread 0 crashed with X86 Thread State (64-bit):
  rax: 0x0000000000000001  rbx: 0x000000010042cca0  rcx: 0x000000010042cca8  rdx: 0x0000000100074f3b
  rdi: 0x000000000000000e  rsi: 0x00007fff5fbfecbc  rbp: 0x00007fff5fbfeba0  rsp: 0x00007fff5fbfeb90
   r8: 0x00007fff5fbff0b0   r9: 0x0000000000000000  r10: 0x00000000ffffffff  r11: 0x000000010083a40b
  r12: 0x0000000000000001  r13: 0x00007fff5fbfecb8  r14: 0x00007fff5fbfecbc  r15: 0x000000010000363e
  rip: 0x00007fff828d489e  rfl: 0x0000000000010202  cr2: 0x0000000100074f3b

Binary Images:
       0x100000000 -        0x100003fff +pole ??? (???)  {REDACTED}
    0x7fff5fc00000 -     0x7fff5fc3bdef  dyld 132.1 (???)  /usr/lib/dyld
    0x7fff81697000 -     0x7fff8169bff7  libmathCommon.A.dylib ??? (???)  /usr/lib/system/libmathCommon.A.dylib
    0x7fff8289c000 -     0x7fff82a5aff7  libSystem.B.dylib ??? (???)  /usr/lib/libSystem.B.dylib
    0x7fff83c4c000 -     0x7fff83cc9fef  libstdc++.6.dylib ??? (???)  /usr/lib/libstdc++.6.dylib
    0x7fffffe00000 -     0x7fffffe01fff  libSystem.B.dylib ??? (???)  /usr/lib/libSystem.B.dylib

Model: MacBookPro4,1, BootROM MBP41.00C1.B03, 2 processors, Intel Core 2 Duo, 2.4 GHz, 2 GB, SMC 1.27f2
Graphics: NVIDIA GeForce 8600M GT, GeForce 8600M GT, PCIe, 256 MB
Memory Module: global_name
AirPort: spairport_wireless_card_type_airport_extreme (0x14E4, 0x8C), Broadcom BCM43xx 1.0 (5.10.91.19)
Bluetooth: Version 2.2.4f3, 2 service, 1 devices, 1 incoming serial ports
Network Service: AirPort, AirPort, en1
Serial ATA Device: Hitachi HTS542520K9SA00, 186.31 GB
Parallel ATA Device: MATSHITADVD-R   UJ-867
USB Device: Built-in iSight, 0x05ac  (Apple Inc.), 0x8502, 0xfd400000
USB Device: Apple Internal Keyboard / Trackpad, 0x05ac  (Apple Inc.), 0x0230, 0x5d200000
USB Device: IR Receiver, 0x05ac  (Apple Inc.), 0x8242, 0x5d100000
USB Device: BRCM2046 Hub, 0x0a5c  (Broadcom Corp.), 0x4500, 0x1a100000
USB Device: Bluetooth USB Host Controller, 0x05ac  (Apple Inc.), 0x820f, 0x1a110000

感谢。

7 个答案:

答案 0 :(得分:4)

您的代码中的其他地方有一个与printf语句无关的错误。你在某个地方踩到内存,但问题直到printf试图用__BAlloc_D2A分配一些内存才会显现出来,因为它用来跟踪空闲内存块的堆数据结构崩溃了已经腐败了。

要尝试检测您在内存上踩踏的地方,可以使用多种工具。如果您使用的是Linux,我建议使用valgrind,它基本上在虚拟机中运行您的代码并告诉您何时执行任何非法操作,例如读/写内存超出范围,读取未初始化的变量等。 ,它在Mac OS X(尚未)中不可用。

一种选择是使用libgmalloc

% cat gmalloctest.c
#include <stdlib.h>
#include <stdio.h>

main()
{
  unsigned *buffer = (unsigned *)malloc(sizeof(unsigned) * 100);
  unsigned i;

  for (i = 0; i < 200; i++) {
    buffer[i] = i;
  }

  for (i = 0; i < 200; i++) {
     printf ("%d  ", buffer[i]);
  }
}

% cc -g -o gmalloctest gmalloctest.c
% gdb gmalloctest
Reading symbols for shared libraries .. done
(gdb) set env DYLD_INSERT_LIBRARIES /usr/lib/libgmalloc.dylib
(gdb) r
Starting program: gmalloctest
Reading symbols for shared libraries .. done
GuardMalloc: Allocations will be placed on 16 byte boundaries.
GuardMalloc:  - Some buffer overruns may not be noticed.
GuardMalloc:  - Applications using vector instructions (e.g., SSE or Altivec) should work.
GuardMalloc: GuardMalloc version 19

Program received signal EXC_BAD_ACCESS, Could not access memory.
Reason: KERN_PROTECTION_FAILURE at address: 0xb000d000
0x00001f65 in main () at gmalloctest.c:10
10          buffer[i] = i;
(gdb) print i
$1 = 100
(gdb) where
#0  0x00001f65 in main () at gmalloctest.c:10
(gdb)

另见Enabling the Malloc Debugging Features

答案 1 :(得分:1)

您可能有指针算术错误或缓冲区溢出,其副作用是打破printf

尝试评论大部分代码(printf除外)并查看它是否崩溃。如果没有,那么一点一点地发表评论,直到你得到崩溃。你会知道问题出在哪里。

此外,如果您使用的是Linux或任何unix版本,请同时使用valgrind

修改

我在错误报告中看到了这一点:

0   libSystem.B.dylib               0x00007fff828d489e __Balloc_D2A + 164

这就是实际崩溃的地方,这似乎是一个低级别的分配例程。我猜你有一个缓冲区溢出,它破坏了空闲列表,使得某些未来的分配中断(例如在这个printf中)。

答案 2 :(得分:1)

当您访问未映射到任何内容的虚拟地址或以不允许的方式访问地址时(例如,尝试写入只读区域),会发生SIGSEGV。如您所说,分段错误可能与堆损坏有关。这是因为在内部,大多数malloc实现将簿记信息与堆上的已分配数据交错。如果该簿记信息被破坏,则malloc的行为未定义。在程序的更晚版本之前,您可能看不到任何错误。

在这种情况下,printf可能在内部分配一些内存,这会触发故障。解决此问题的最佳方法可能是使用valgrind运行程序,它会在发生任何堆损坏时立即通知您。

答案 3 :(得分:0)

第一个可能性是你只是普通的malloc()为你的数组提供了足够的内存,而printf()试图使malloc()多一点,并且失败了。我认为这是不太可能的。

第二个可能性是你的printf()并不像你所展示的那么简单,而是一些相当复杂的多级指针表达式,而且这个表达式在某处变得很疯狂。

答案 4 :(得分:0)

printf的某些实现在处理“%f”时执行mallocs。如果它正在执行此操作,那么如果您在某个时刻溢出内存(即写入超过分配结束),则printf可以尝试进行分配并发现堆已损坏并抛出错误...

只是一个想法。

编辑:它可能值得看看你的状态数组是如何被填充的......其他2个看起来很好,但是你可以在任何地方写完......

答案 5 :(得分:0)

printf("%f", parm)期望参数为double。你的f是一个隐式转换为double的浮点数。

也许隐含的转换搞砸了???

尝试显式转化

float f = 0.5f;
printf("%f\n",(double)f);

甚至

float f = 0.5f;
double ff = f;
printf("%f\n",ff);

答案 6 :(得分:0)

只是一个猜测,但你做过#include <stdlib.h>吗?如果没有范围内malloc()的原型,编译器会假定malloc()返回int,这显然不是真的。

如果我是对的(即使是其他方式),它暴露了在C中不转换malloc()的返回值的原因。请注意,如果要为C和C ++编写代码,则需要,但是对于纯C,不要强制转换malloc()的返回值,让编译器为你做正确的事。

所以,而不是:

T *data = (T *) malloc(sz * sizeof(T));

改为:

#include <stdlib.h>
...
T *data = malloc(sz * sizeof *data);

此处,T是任何类型。优点是:

  1. 如果忘记#include <stdlib.h>
  2. ,编译器会抱怨
  3. 如果您更改data的类型,则malloc()来电无需更改,
  4. 我认为它更易于阅读且不易出错。
  5. 通过转换malloc()的返回值,您不会让编译器有机会警告您缺少stdlib.h的包含。