堆上分配的内存的总线错误

时间:2017-03-06 16:35:33

标签: c++ solaris bus-error

我在这样的代码中有总线错误

char* mem_original;
int int_var = 987411;
mem_original = new char [250];
memcpy(&mem_original[250-sizeof(int)], &int_var, sizeof(int));
...
const unsigned char* mem_u_const = (unsigned char*)mem_original;
...
const unsigned char *location = mem_u_const + 250 - sizeof(int);

std::cout << "sizeof(int) = " << sizeof(int) << std::endl;//it's printed out as 4
std::cout << "byte 0 = " << int(*location) << std::endl;
std::cout << "byte 1 = " << int(*(location+1)) << std::endl;
std::cout << "byte 2 = " << int(*(location+2)) << std::endl;
std::cout << "byte 3 = " << int(*(location+3)) << std::endl;
int original_var = *((const int*)location);
std::cout << "original_var = " << original_var << std::endl;

这很好用,打印出来:

sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
original_var = 987411

然后失败了:

sizeof(int) = 4
byte 0 = 0
byte 1 = 15
byte 2 = 17
byte 3 = 19
Bus Error

它的内置和放大在Solaris OS上运行(C ++ 5.12) Linux上的相同代码(gcc 4.12)&amp; Windows(msvc-9.0)运行良好。

我们可以看到:

  1. 内存是由new []。
  2. 在堆上分配的
  3. 内存可访问(我们可以逐字节读取)
  4. 内存中包含应该存在的内容,而不是已损坏的内容。
  5. 那么可能是什么原因导致总线错误?我应该在哪里看?

    UPD: 如果我在location的末尾记得(...)original_var,那就行了。但*((const int*)location)中的问题是什么?

3 个答案:

答案 0 :(得分:4)

对于没有具有对齐限制的硬件经验的开发人员(例如SPARC),这是一个常见问题。虽然存在性能影响,但x86硬件非常原谅未对齐的访问权限。其他类型的硬件? SIGBUS

这行代码:

int original_var = *((const int*)location);

调用未定义的行为。您正在使用unsigned char *并将其指向的内容解释为int。你不能安全地做到这一点。期。这是未定义的行为 - 因为你正在经历的原因。

您违反了严格的别名规则。请参阅What is the strict aliasing rule?简而言之,您不能将某种类型的对象称为另一种类型。 char *没有,也无法引用int

Oracle的Solaris Studio编译器实际上提供了一个命令行参数,可以让您在SPARC硬件上使用它 - -xmemalign=1i(参见https://docs.oracle.com/cd/E19205-01/819-5265/bjavc/index.html)。虽然对GCC公平,但如果没有该选项,您在代码中执行的操作仍然会在Studio编译器下SIGBUS

或者,正如您已经注意到的那样,您可以使用memcpy()来复制字节,无论它们是什么 - 只要您知道源对象可以安全地复制到目标对象中 - 是的,那里是为真的情况。

答案 1 :(得分:3)

编译代码时出现以下警告:

main.cpp:19:26: warning: cast from 'const unsigned char *' to 'const int *' increases required alignment from 1 to 4 [-Wcast-align]
    int original_var = *((const int*)location);
                         ^~~~~~~~~~~~~~~~~~~~

这似乎是导致总线错误的原因,因为improperly aligned access can cause a bus error

答案 2 :(得分:2)

虽然我现在无法访问SPARC进行测试,但我很清楚我在该平台上的经验表明这一行是您的问题:

const unsigned char *location = mem_u_const + 250 - sizeof(int);

mem_u_const块最初由new分配给一个字符数组。由于sizeof(unsigned char)为1且sizeof(int)为4,因此您将添加246个字节。这不是4的倍数。

在SPARC上,如果CPU与4字节边界对齐,则CPU只能读取4字节字。您尝试读取未对齐的字是导致总线错误的原因。

我建议为struct分配一个unsigned char数组,后跟一个int,而不是一堆指针数学和类似于导致此错误的数组。