我正在使用TCP echo示例(Ubuntu主软件包中当前提供的是1.62)。
它非常适合小事情,您可以看到它的缓冲区为1024,并使用async_read_some
。
但是随后我尝试将其发送给Python字符串("A"*4096)+("B"*4096)+("C"*4096)
...我将看到4次对读取处理程序的调用,每个调用1024位......即它将打印所有的As,但不会打印任何B或C
预期的行为::如果套接字中有4096 * 3个数据,则对async_read_some
的后续调用应一次将所有数据拉出1024个??
在这样的回显协议中,一个人不能使用async_read
,因为可变数据是通过电线传递的。问题是async_read_some
被忽略/删除了仍要从套接字读取的数据。
如何修复示例代码?
答案 0 :(得分:0)
我采取了该示例,并使用了您声称的客户代码:
#!/usr/bin/env python
import socket
TCP_IP = '127.0.0.1'
TCP_PORT = 6767
BUFFER_SIZE = 1024
MESSAGE = ("A"*4096)+("B"*4096)+("C"*4096);
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect((TCP_IP, TCP_PORT))
s.send(MESSAGE)
received = "";
while (len(received) < len(MESSAGE)):
data = s.recv(BUFFER_SIZE)
print "received data: %d bytes ending in ...%s" % (len(data), data[-10:])
received += data
s.close()
它可以正确运行并打印
sehe ~ Projects stackoverflow ./sotest 6767&
sehe ~ Projects stackoverflow python ./test.py
received data: 1024 bytes ending in ...AAAAAAAAAA
received data: 1024 bytes ending in ...AAAAAAAAAA
received data: 1024 bytes ending in ...AAAAAAAAAA
received data: 1024 bytes ending in ...AAAAAAAAAA
received data: 1024 bytes ending in ...BBBBBBBBBB
received data: 1024 bytes ending in ...BBBBBBBBBB
received data: 1024 bytes ending in ...BBBBBBBBBB
received data: 1024 bytes ending in ...BBBBBBBBBB
received data: 1024 bytes ending in ...CCCCCCCCCC
received data: 1024 bytes ending in ...CCCCCCCCCC
received data: 1024 bytes ending in ...CCCCCCCCCC
received data: 1024 bytes ending in ...CCCCCCCCCC
所以你做错了。
预期的行为:如果套接字中有4096 * 3个数据,则随后对async_read_some的调用应一次将所有数据拉出1024个??
是的。这正是发生的情况。提醒您,您不应该假定1024个块中的块“到达”。根据中间OS /网络层中的缓冲,它们可能碰巧以较小的块到达。 IOW:TCP是一种流协议,而数据包是一种实现细节,您通常不应依赖于¹
在这样的回声协议中,不能使用async_read,因为可变数据是通过电线传递的。
数据始终是可变的(否则将没有理由发送数据)。 async_read
可以始终用于read
所在的位置,因为它只是同一功能的异步IO版本。
¹使用各种高级技术/标记,您可以在某种程度上控制这些效果,但是它们部分取决于平台,并且几乎总是以一定的余量运行,从而为OS /网络层留出了优化网络性能的余地。