struct.error:unpack需要长度为4的字符串参数

时间:2010-04-10 01:12:21

标签: python struct

Python说我需要4个字节的格式代码为“BH”:

struct.error: unpack requires a string argument of length 4

以下是代码,我认为需要3个字节:

major, minor = struct.unpack("BH", self.fp.read(3))

“B”无符号字符(1字节)+“H”无符号短(2字节)= 3字节(!?)

struct.calcsize(“BH”)表示4个字节。

编辑:文件大约是800 MB,这是文件的前几个字节,所以我很确定还有剩余的数据需要读取。

2 个答案:

答案 0 :(得分:22)

struct模块模仿C结构。处理器读取奇数地址上的16位字或者不能被4整除的地址上的32位双字需要更多的CPU周期,因此结构添加“填充字节”以使结构成员落在自然边界上。考虑:

struct {                   11
    char a;      012345678901
    short b;     ------------
    char c;      axbbcxxxdddd
    int d;
};

此结构将占用12个字节的内存(x为填充字节)。

Python的工作方式类似(请参阅struct文档):

>>> import struct
>>> struct.pack('BHBL',1,2,3,4)
'\x01\x00\x02\x00\x03\x00\x00\x00\x04\x00\x00\x00'
>>> struct.calcsize('BHBL')
12

编译器通常有一种消除填充的方法。在Python中,任何=<>!将消除填充:

>>> struct.calcsize('=BHBL')
8
>>> struct.pack('=BHBL',1,2,3,4)
'\x01\x02\x00\x03\x04\x00\x00\x00'

小心让struct处理填充。在C中,这些结构:

struct A {       struct B {
    short a;         int a;
    char b;          char b;
};               };

通常分别为4和8个字节。在结构用于阵列的情况下,填充发生在结构的末端。这使得'a'成员在数组中稍后的结构的正确边界上保持对齐。 Python的struct模块最后没有填充:

>>> struct.pack('LB',1,2)
'\x01\x00\x00\x00\x02'
>>> struct.pack('LBLB',1,2,3,4)
'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00\x04'

答案 1 :(得分:8)

默认情况下,在许多平台上,short将与2的倍数对齐,因此在char之后会添加填充字节。

要禁用此功能,请使用:struct.unpack("=BH", data)。这将使用标准对齐,不添加填充:

>>> struct.calcsize('=BH')
3

=字符将使用本机字节排序。您也可以使用<>代替=来强制执行小端或大端字节排序。