在Python中序列化C结构并通过套接字发送

时间:2015-12-30 16:36:56

标签: python c sockets serialization ctypes

我正在尝试序列化以下C结构

struct packet
{
    int id;
    unsigned char *ce;
    unsigned char *syms;
};
在Python中

并通过套接字发送它。 cesyms指向的元素数量为N。目前我正在这样做。首先,我使用ctypes将结构包装到

class Packet(Structure):
    _fields_ = [("id",  c_int),
                ("ce", POINTER(c_ubyte)),
                ("syms", POINTER(c_ubyte))]

然后,我使用fill_data中的ctypes.POINTER(Packet)函数填充以下类的对象:

class DataLoad:
    def __init__(self):
        self.id = -1
        self.ce = []
        self.syms = []

    def fill_data(self, pkt_p):
        """ pkt_p is POINTER(Packet)
        """
        self.id = pkt_p.contents.id
        self.ce = []
        for i in range(N):
            self.ce.append(pkt_p.contents.ce[i])
        self.syms = []
        for i in range(N):
            self.syms.append(pkt_p.contents.syms[i])

最后,我只使用pickle.dumps(DataLoad)生成字节流并发送。

这种方法效果很好。但是,它似乎很慢。我可以看到的一个原因是pickle.dumps带来了很多开销。例如,如果C结构只有1024字节,我可能必须使用pickle为每个结构发送近4000个字节。另外,打包/填充DataLoad也需要时间。

所以我的问题是,我有更好的选择在python中序列化这个C结构并发送吗?我宁愿避免pickle并填充一个单独的类实例。感谢。

2 个答案:

答案 0 :(得分:1)

首先,如果您知道元素的数量为N,我建议您将结构更改为:

class Packet(Structure):
    _fields_ = [("id", c_int),
                ("ce", c_ubyte * N),
                ("syms", c_ubyte * N)]

接下来,如果您只想发送结构数据,则不需要整理所有内容。只需发送数据包数据:

p = Packet()
p.id = 555
...
# cast the struct to a pointer to a char array
pdata = ctypes.cast(ctypes.byref(p), ctypes.POINTER(ctypes.c_char * ctypes.sizeof(p)))
# now you can just save/send the struct data
someSocketObject.send(pdata.contents.raw)

要阅读另一方的数据:

p = Packet()
raw = someSocketObject.read(ctypes.sizeof(p))
ctypes.memmove(ctypes.pointer(p),raw,ctypes.sizeof(p))

答案 1 :(得分:1)

最后,我想出了以下方法来手动序列化`Packet'没有使用泡菜的实例。

def serialize(pkt_p, size_g, size_p):
    """ Serialize Packet instance
        size_g - number of elements pointed by ce
        size_p - number of elements pointed by syms
        Return a byte stream
    """ 
    pktstr = b''
    pktstr += struct.pack('i', pkt_p.contents.id)
    pktstr += string_at(pkt_p.contents.ce, size_g)
    pktstr += string_at(pkt_p.contents.syms, size_p)
    return pktstr

def deserialize(pkt_p, pktstr, size_g, size_p):
    """ De-serialize pktstr and fill a POINTER(Packet)
    """
    pkt_p.contents.id = struct.unpack('i', pktstr[0:4])[0]
    ce = (c_ubyte * size_g).from_buffer_copy(pktstr[4:4+size_g])
    pkt_p.contents.ce = cast(ce, POINTER(c_ubyte))
    syms = (c_ubyte * size_p).from_buffer_copy(pktstr[-size_p:])
    pkt_p.contents.syms = cast(syms, POINTER(c_ubyte))

string_at()from_buffer_copy()功能是关键。