联盟数据结构对齐

时间:2013-12-09 05:43:12

标签: c struct standards unions

我正在使用一些(我认为的)糟糕的代码,它有一个像:

这样的联合
union my_msg_union
{
  struct message5;
  char buffer[256]
} message;

缓冲区中有来自通信的256个字节。结构类似于:

struct message5 {
 uint8 id;
 uint16 size;
 uint32 data;
 uint8 num_ids;
 uint16 ids[4];
} message5d

相同的代码正在大量架构上编译(8位AVR,16位菲利普,32位手臂,32位x86和amd64)。

我想到的问题是使用了union:代码只是将一串串行接收到的字节放入缓冲区,然后通过结构读取值,而不考虑结构的对齐/填充。

果然,快速查看不同系统上的sizeof(message5d)会产生不同的结果。

然而令我感到惊讶的是,只要存在与char []的联合,所有系统中所有类型的所有结构的实例都会丢弃它们的填充/对齐,并确保是连续的字节。

这是C标准还是编译器作者为“帮助”提供的东西?

1 个答案:

答案 0 :(得分:3)

此代码演示了与您描述的行为相反的行为:

#include <stddef.h>
#include <stdint.h>
#include <stdio.h>

struct message5
{
    uint8_t id;
    uint16_t size;
    uint32_t data;
    uint8_t num_ids;
    uint16_t ids[4];
};

#if !defined(NO_UNION)
union my_msg_union
{
    struct message5 msg;
    char buffer[256];
};
#endif /* NO_UNION */

struct data
{
    char const *name;
    size_t offset;
};

int main(void)
{
    struct data offsets[] =
    {
        { "message5.id", offsetof(struct message5, id) },
        { "message5.size", offsetof(struct message5, size) },
        { "message5.data", offsetof(struct message5, data) },
        { "message5.num_ids", offsetof(struct message5, num_ids) },
        { "message5.ids", offsetof(struct message5, ids) },
#if !defined(NO_UNION)
        { "my_msg_union.msg.id", offsetof(union my_msg_union, msg.id) },
        { "my_msg_union.msg.size", offsetof(union my_msg_union, msg.size) },
        { "my_msg_union.msg.data", offsetof(union my_msg_union, msg.data) },
        { "my_msg_union.msg.num_ids", offsetof(union my_msg_union, msg.num_ids) },
        { "my_msg_union.msg.ids", offsetof(union my_msg_union, msg.ids) },
#endif /* NO_UNION */
    };
    enum { NUM_OFFSETS = sizeof(offsets) / sizeof(offsets[0]) };

    for (size_t i = 0; i < NUM_OFFSETS; i++)
        printf("%-25s  %3zu\n", offsets[i].name, offsets[i].offset);
    return 0;
}

示例输出(Mac OS X 10.9 Mavericks上的GCC 4.8.2,64位编译):

message5.id                  0
message5.size                2
message5.data                4
message5.num_ids             8
message5.ids                10
my_msg_union.msg.id          0
my_msg_union.msg.size        2
my_msg_union.msg.data        4
my_msg_union.msg.num_ids     8
my_msg_union.msg.ids        10

联合中的偏移量与结构中的偏移量相同,正如C标准所要求的那样。

你必须根据上面的代码提供一个完整的编译反例,并指定你正在编译的编译器和平台,以获得你的不正确的答案 - 如果你确实可以重现不正确的答案。

我注意到我必须将uint8等更改为uint8_t,但我认为这没有任何区别。如果是,则需要指定从{.1}}获取名称的标题。


已更新代码,可以使用或不使用uint8进行编译。使用union编译时的输出:

-DNO_UNION