我在使用C语言中的Berkeley套接字API进行套接字编程方面有一些经验。通常,任何套接字编程都需要一种策略,使接收套接字能够知道它应该接收多少数据。这可以使用标题长度字段或分隔符字符来完成。通常,我更喜欢包含长度的标题字段。
当然,我们也需要知道长度标题字段本身的大小,这只是一个固定大小的值,必须由发送方和接收方商定。在C中,这很容易实现,因为本机整数类型是固定大小和二进制格式,所以你可以这样说:
uint16_t bytes_to_receive;
recv(sock, &bytes_to_receive, sizeof(bytes_to_receive), 0);
bytes_to_receive = ntohs(bytes_to_receive);
// Now receive 'bytes_to_receive' bytes...
但是如何使用Python套接字完成这种习惯用法呢?在Python中,整数是对象,而pickle整数是可变长度的字节数组。所以我们不能使用pickle整数作为长度头字段,因为我们无法确定它的大小(以字节为单位)。
当然,我总是可以发送一个包含二进制整数的已知大小的字节数组,如b'\x05\x00'
,以小端格式创建一个值为5的16位二进制整数,但这确实没有似乎是正确的方法。
那么,这通常如何在Python中完成?
答案 0 :(得分:5)
您可以使用struct
模块将Python整数转换为字符串/字节数组。只需读取与类型标题大小相对应的字节数,并将其转换为struct
模块,您应该好好去。 (注意:在编码/解码时一定要使用正确的endian-flags)
答案 1 :(得分:0)
sys
模块提供getsizeof()
函数,该函数以字节为单位返回对象的大小(使用对象__sizeof__
方法)。如果您正在使用自定义对象,则需要仔细测试__sizeof__
实现,但听起来这应该适用于标准类型。
或者,您也可以将数据序列化为pickle
或json
并计算字符串中的字符数,但这可能会导致性能下降。
使用任一种方法,如果要传输可变长度数据,首先传输大小,然后使用该值确定要读取多少数据。
>>> import sys >>> a = [1,3,4] >>> sys.getsizeof(a) 96 >>> l = 0 >>> for i in a: ... l += sys.getsizeof(i) ... >>> print l 72 >>>
答案 2 :(得分:0)
ctypes module可以为您在示例中使用的C类型sizeof()
提供uint16
:
>>> import ctypes
>>> ctypes.sizeof(ctypes.c_uint16)
2