用于在Python中接收套接字的成语

时间:2011-03-21 16:25:39

标签: python c sockets

我在使用C语言中的Berkeley套接字API进行套接字编程方面有一些经验。通常,任何套接字编程都需要一种策略,使接收套接字能够知道它应该接收多少数据。这可以使用标题长度字段或分隔符字符来完成。通常,我更喜欢包含长度的标题字段。

当然,我们需要知道长度标题字段本身的大小,这只是一个固定大小的值,必须由发送方和接收方商定。在C中,这很容易实现,因为本机整数类型是固定大小和二进制格式,所以你可以这样说:

uint16_t bytes_to_receive;
recv(sock, &bytes_to_receive, sizeof(bytes_to_receive), 0);
bytes_to_receive = ntohs(bytes_to_receive);
// Now receive 'bytes_to_receive' bytes...

但是如何使用Python套接字完成这种习惯用法呢?在Python中,整数是对象,而pickle整数是可变长度的字节数组。所以我们不能使用pickle整数作为长度头字段,因为我们无法确定它的大小(以字节为单位)。

当然,我总是可以发送一个包含二进制整数的已知大小的字节数组,如b'\x05\x00',以小端格式创建一个值为5的16位二进制整数,但这确实没有似乎是正确的方法。

那么,这通常如何在Python中完成?

3 个答案:

答案 0 :(得分:5)

您可以使用struct模块将Python整数转换为字符串/字节数组。只需读取与类型标题大小相对应的字节数,并将其转换为struct模块,您应该好好去。 (注意:在编码/解码时一定要使用正确的endian-flags)

答案 1 :(得分:0)

sys模块提供getsizeof()函数,该函数以字节为单位返回对象的大小(使用对象__sizeof__方法)。如果您正在使用自定义对象,则需要仔细测试__sizeof__实现,但听起来这应该适用于标准类型。

或者,您也可以将数据序列化为picklejson并计算字符串中的字符数,但这可能会导致性能下降。

使用任一种方法,如果要传输可变长度数据,首先传输大小,然后使用该值确定要读取多少数据。

其他说明:

  • 如果您还没有,那么您还需要阅读sockets的api文档。
  • 请注意,列表等复合类型需要额外的空间,因此:
    >>> import sys
    >>> a = [1,3,4]
    >>> sys.getsizeof(a)
    96
    >>> l = 0
    >>> for i in a:
    ...     l += sys.getsizeof(i)
    ... 
    >>> print l
    72
    >>>

答案 2 :(得分:0)

ctypes module可以为您在示例中使用的C类型sizeof()提供uint16

>>> import ctypes
>>> ctypes.sizeof(ctypes.c_uint16)
2