我使用epoll实现TCP套接字通信来监控所有客户端事件,只有一个线程处理for循环中的所有客户端。每个套接字都是非阻塞的。
现在我遇到了一个问题,当客户端发送的数据超过MTU时,意味着几个分片包,服务器总是无法完全读取所有数据。 如下所示,我首先阅读头部,从头部获取pdu len,然后阅读pdu部分。
问题是虽然我成功地读了头,紧跟着pdu recv(),但它总是多次返回EAGAIN。所以我的重试会破裂。 因为服务器需要处理成千上万的客户端事件,所以我认为让重试始终继续是一个很好的性能消耗,这是不容忍的。
我使用tcpdump捕获来自客户端的数据包,每个数据包都碎片到最大1448字节数据,但是头只有5个字节,为什么我能成功读取头部,但是下面的数据recv()操作会返回EAGAIN?当数据已经到达recv缓冲区时,是否可能recv返回EAGAIN?在我看来,我可以读取前5个字节,因此必须在recv缓冲区中读取更多数据。
可能与tcp / ip堆栈中的汇编过程有关。 代码如下,每个pdu recv,需要10次或更多次重试,也许是成功。
...
#define HDR_LEN 5
n = epoll(epfd, events, 1000, -1)
for(i =0; i < n; i++)
{
uint8 pHdr[HDR_LEN] = {0};
uint16 pdulen = 0, offset =0;
infd = events[i].fd;
nRead = recv(infd, pHdr, HDR_LEN); // read the data head first
pdulen = ntohs(*(uint16 *)(pHdr+2)); // get the pdu len from the head
uint8 *pbuf = malloc(pdulen+HDR_LEN);
memcpy(pbuf, pHdr, HDR_LEN); // move the head to buf
while(offset != pdulen) // then read the pdu data
{
nRead = recv(infd, pbuf+HDR_LEN+offset, pdulen-offset);
if (nRead <=0)
{
if (nRead == -1 && errno == EAGAIN) // resource temporarily unavailable
{
if (retry < 5)
{
usleep(500);
retry++;
continue;
}
else
break; // already try 5 times, should always continue?
}
else
break;
}
else
{
offset += nRead;
retry = 0;
}
}
if (offset == pdulen)
process(pbuf, pdulen+HDR_LEN); // process the complete data
...
}
...
答案 0 :(得分:0)
epoll
会告诉您是否可以recv
无阻塞,一次。如果recv
使用套接字中的所有数据,则下一个recv
将阻塞,直到有更多数据,或返回EAGAIN(如果是非阻塞套接字)。
常见的模式是:
select/poll/epoll
检测何时可以读取套接字。recv
一次,并将接收到的数据附加到缓冲区。select/poll/epoll
告诉您何时可以阅读更多内容。