Python说我需要4个字节的格式代码为“BH”:
struct.error: unpack requires a string argument of length 4
以下是代码,我认为需要3个字节:
major, minor = struct.unpack("BH", self.fp.read(3))
“B”无符号字符(1字节)+“H”无符号短(2字节)= 3字节(!?)
struct.calcsize(“BH”)表示4个字节。
编辑:文件大约是800 MB,这是文件的前几个字节,所以我很确定还有剩余的数据需要读取。
答案 0 :(得分:22)
struct模块模仿C结构。处理器读取奇数地址上的16位字或者不能被4整除的地址上的32位双字需要更多的CPU周期,因此结构添加“填充字节”以使结构成员落在自然边界上。考虑:
struct { 11
char a; 012345678901
short b; ------------
char c; axbbcxxxdddd
int d;
};
此结构将占用12个字节的内存(x为填充字节)。
Python的工作方式类似(请参阅struct文档):
>>> import struct
>>> struct.pack('BHBL',1,2,3,4)
'\x01\x00\x02\x00\x03\x00\x00\x00\x04\x00\x00\x00'
>>> struct.calcsize('BHBL')
12
编译器通常有一种消除填充的方法。在Python中,任何=<>!将消除填充:
>>> struct.calcsize('=BHBL')
8
>>> struct.pack('=BHBL',1,2,3,4)
'\x01\x02\x00\x03\x04\x00\x00\x00'
小心让struct处理填充。在C中,这些结构:
struct A { struct B {
short a; int a;
char b; char b;
}; };
通常分别为4和8个字节。在结构用于阵列的情况下,填充发生在结构的末端。这使得'a'成员在数组中稍后的结构的正确边界上保持对齐。 Python的struct模块最后没有填充:
>>> struct.pack('LB',1,2)
'\x01\x00\x00\x00\x02'
>>> struct.pack('LBLB',1,2,3,4)
'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00\x04'
答案 1 :(得分:8)
默认情况下,在许多平台上,short将与2的倍数对齐,因此在char之后会添加填充字节。
要禁用此功能,请使用:struct.unpack("=BH", data)
。这将使用标准对齐,不添加填充:
>>> struct.calcsize('=BH')
3
=
字符将使用本机字节排序。您也可以使用<
或>
代替=
来强制执行小端或大端字节排序。