Question

（sizeof）char 始终在32位GCC编译器中返回 1 。

但由于32位编译器的基本块大小为4，当基本大小为4字节时，char如何占用单个字节???

考虑以下因素：

struct st 
{
int a;
char c;
};

sizeof（st）返回为8 与默认块大小4字节一致（因为分配了2个块）

我永远无法理解为什么 sizeof（char）在分配大小为4的块时返回为1 。

有人可以解释这个???

我会非常感谢任何回复解释!!!

编辑：'bits'的拼写错误已更改为'bytes'。我对第一次编辑的人抱歉。我回滚了编辑，因为我没有注意到你做的改变。感谢所有那些明确表示必须改变的人，特别是@Mike Burton为了解决这个问题，以及@jalf，他似乎对我对概念的理解得出结论!!

Answer 1

sizeof(char)总是1.永远。您所谈论的“块大小”只是机器的本机字大小 - 通常是导致最有效操作的大小。您的计算机仍然可以单独处理每个字节 - 这就是sizeof运算符告诉您的内容。执行sizeof(int)时，它会返回4，告诉您计算机上int为4个字节。同样，您的结构长度为8个字节。 sizeof中没有关于字节中有多少位的信息。

你的结构长8个字节而不是5个（正如你所料）的原因是编译器正在将 padding 添加到结构中，以便使所有内容与本机字长保持良好对齐，再次提高效率。大多数编译器为您提供打包结构的选项，可以使用#pragma指令或其他编译器扩展，在这种情况下，您可以强制您的结构采用最小尺寸，无论您的机器是什么字长。

char的大小为1，因为这是您的计算机可以处理的最小访问大小 - 对于大多数计算机而言是8位值。 sizeof运算符为您提供所有其他数量的大小，单位为char个对象的大小与您询问的大小相同。出于性能原因，编译器会将 padding （请参阅下面的链接）添加到您的数据结构中，因此它在实践中比您在查看结构定义时想象的要大。

有一篇名为Data structure alignment的维基百科文章有很好的解释和例子。

Answer 2

是结构对齐。 c使用1个字节，未使用3个字节。更多here（带图片！）

Answer 3

演示结构对齐的示例代码：

struct st 
{
int a;
char c;
};

struct stb
{
int a;
char c;
char d;
char e;
char f;
};

struct stc
{
int a;
char c;
char d;
char e;
char f;
char g;
};

std::cout<<sizeof(st) << std::endl; //8
std::cout<<sizeof(stb)  << std::endl; //8
std::cout<<sizeof(stc)  << std::endl; //12

struct的大小大于其各个组件的总和，因为它被32位编译器设置为可被4个字节整除。这些结果可能在不同的编译器上有所不同，特别是如果它们位于64位编译器上。

Answer 4

首先，sizeof返回多个字节，而不是位。 sizeof(char) == 1告诉您char长度为8位（一个字节）。 C中的所有基本数据类型至少有一个字节长。

您的结构返回大小8.这是三件事的总和：int的大小，char的大小（我们知道1），以及编译器添加到结构中的任何额外填充的大小。由于许多实现使用4字节int，这意味着您的编译器正在为您的结构添加3个字节的填充。最有可能是在char之后添加，以使结构的大小为4的倍数（32位块中32位CPU访问数据最有效，32位是4字节）。 / p>

编辑：仅因为块大小为四个字节并不意味着数据类型不能小于四个字节。当CPU将一个字节char加载到32位寄存器中时，该值将自动（由硬件）进行符号扩展，以使其填充寄存器。 CPU足够智能，可以以N字节为增量处理数据（其中N是2的幂），只要它不大于寄存器即可。将数据存储在磁盘或内存中时，没有理由将每个char存储为四个字节。您的结构中的char看起来好像是四个字节长，因为它后面添加了填充。如果您将结构更改为两个 char变量而不是一个，您应该看到结构的大小相同（您添加了额外的数据字节，并添加了编译器）少一个填充字节。）

Answer 5

C和C ++中的所有对象大小都是根据 bytes 定义的，而不是 bits 。字节是计算机上最小的可寻址内存单位。一位是一个二进制数字，0或1。

在大多数计算机上，一个字节是8位（因此一个字节可以存储0到256之间的值），尽管计算机存在其他字节大小。

内存地址标识字节，即使在32位计算机上也是如此。地址N和N + 1指向两个后续字节。

int，通常为32位，覆盖4个字节，这意味着存在4个不同的内存地址，每个内存都指向int的一部分。

在32位机器中，所有 32 实际上意味着CPU设计为使用32位值有效工作，并且地址长度为32位。这并不意味着只能以32位的块来寻址存储器。

CPU仍然可以处理单个字节，例如，在处理char时非常有用。

至于你的例子：

struct st 
{
int a;
char c;
};

sizeof(st)返回8不是因为所有结构都有一个可被4整除的大小，而是因为 alignment 。为了使CPU有效地读取整数，它必须位于可被整数（4字节）整除的地址上。因此，int可以放在地址8,12或16上，但不能放在地址11上。

char只要求其地址可以被char（1）的大小整除，因此可以将其放在任何地址上。

所以理论上，编译器可以给你的结构大小为5个字节......除非你创建了一个st个对象的数组，否则这个不行。< / p>

在一个数组中，每个对象都紧跟在前一个对象之后，没有填充。因此，如果数组中的第一个对象放置在可被4整除的地址，那么下一个对象将放置在高于5字节的地址处，这将不可被4整除，因此第二个对象将被整除数组中的struct无法正确对齐。

要解决此问题，编译器会在结构中插入填充，因此其大小将成为其对齐要求的倍数。

不是因为不可能创建大小不是4的倍数的对象，而是因为st结构的一个成员需要4字节对齐，所以每次都是编译器在内存中放置int，它必须确保它被放置在可被4整除的地址。

如果你创建了两个char的结构，它的大小不会达到4.它通常会得到2的大小，因为当它只包含char时，该对象可以放在任何地址，因此对齐不是问题。

Answer 6

Sizeof以字节为单位返回值。你在谈论比特。 32位架构是字对齐和字节引用。架构如何存储char是无关紧要的，但对于编译器，您必须一次引用1个字节的字符，即使它们使用的字节少于1个字节。

这就是sizeof（char）为1的原因。

整数是32位，因此sizeof（int）= 4，双精度是64位，因此sizeof（double）= 8等。

Answer 7

由于优化填充被添加，因此对象的大小为 1,2或n * 4字节（或类似的东西，谈论x86）。这就是为什么添加填充到5字节对象和1字节没有。单char不需要填充，可以在1个字节上分配，我们可以将它存储在分配有malloc(1)的空间中。 st无法存储在malloc(5)分配的空间中，因为正在复制st结构时，正在复制整个8个字节。

Answer 8

它的工作方式与使用半张纸相同。您将一个部分用于char，另一部分用于其他部分。编译器将隐藏此信息，因为将字符加载和存储到32位处理器寄存器取决于处理器。

有些处理器只有加载和存储32位部分的指令，其他处理器必须使用二进制操作来提取char的值。

对char进行寻址是因为AFAIR定义为最小的可寻址内存。在32位系统上，指向两个不同整数的指针将至少相隔4个地址点，而char地址只相隔1个。

理解32位C编译器中的sizeof（char）

8 个答案: