我正在搞乱制作二进制数据解析器,虽然我可以回到C上,但我想知道是否可以使用Python来完成任务。
我对如何实现这一点有所了解,而我目前的实现看起来像这样:
from ctypes import *
class sHeader(Structure):
_fields_ = [("CC", c_uint8, 4),
("AFC", c_uint8, 2),
("TSC", c_uint8, 2),
("PID", c_uint16, 13),
("TP", c_uint16, 1),
("PSI", c_uint16, 1),
("TEI", c_uint16, 1),
("SyncByte", c_uint8)]
class Header(Union):
_fields_ = [("sData", sTsHeader),
("ulData", c_uint32)]
head = Header()
head.ulData = 0xffffffff
print(head.ulData)
print(head.sData.SyncByte)
print(sHeader.SyncByte)
print(sHeader.TEI)
print(sHeader.PSI)
print(sHeader.TP)
print(sHeader.PID)
print(sHeader.TSC)
print(sHeader.AFC)
print(sHeader.CC)
print(sizeof(sHeader))
print(sizeof(c_uint8))
print(sizeof(c_uint16))
print(sizeof(c_uint32))
产生此输出:
V:\>C:\Python27\python.exe WidiUnpacker.py
0xffffffffL
0x0
<Field type=c_ubyte, ofs=4, size=1>
<Field type=c_ushort, ofs=2:15, bits=1>
<Field type=c_ushort, ofs=2:14, bits=1>
<Field type=c_ushort, ofs=2:13, bits=1>
<Field type=c_ushort, ofs=2:0, bits=13>
<Field type=c_ubyte, ofs=0:6, bits=2>
<Field type=c_ubyte, ofs=0:4, bits=2>
<Field type=c_ubyte, ofs=0:0, bits=4>
6
1
2
4
所以......在我看来,我的字节不是单词,而是单词。我不太了解Python或ctypes来理解它为什么,但它现在正在打败我的目的。有什么想法吗?
答案 0 :(得分:6)
你的sHeader
有4位字段,然后是2位字段,然后是2位字段(总共8位= 1字节)...但是接下来的项目是c_uint16
需要在2字节边界上对齐,因此跳过一个字节并在取13位之前移到字节2。
如果您不想要(并且显然不需要),只需将所有内容设为c_uint32
或类似内容:
from ctypes import *
class sHeader(Structure):
_fields_ = [("CC", c_uint32, 4),
("AFC", c_uint32, 2),
("TSC", c_uint32, 2),
("PID", c_uint32, 13),
("TP", c_uint32, 1),
("PSI", c_uint32, 1),
("TEI", c_uint32, 1),
("SyncByte", c_uint32, 8)] # note: added 8 here
print sHeader.PID
print sHeader.SyncByte
结果:
<Field type=c_uint, ofs=0:8, bits=13>
<Field type=c_uint, ofs=0:24, bits=8>
(我选择了uint32,因为你的位字段加起来是32位。我在这里使用Python 2.7,因此print
上没有括号。)
答案 1 :(得分:5)
您可以使用_pack_
类属性控制对齐:
class sHeader(Structure):
_pack_ = 1
结果
4294967295
255
<Field type=c_ubyte, ofs=3, size=1>
<Field type=c_ushort, ofs=1:15, bits=1>
<Field type=c_ushort, ofs=1:14, bits=1>
<Field type=c_ushort, ofs=1:13, bits=1>
<Field type=c_ushort, ofs=1:0, bits=13>
<Field type=c_ubyte, ofs=0:6, bits=2>
<Field type=c_ubyte, ofs=0:4, bits=2>
<Field type=c_ubyte, ofs=0:0, bits=4>
4
1
2
4