我试图找出一种使用perl解析数据流的正确方法。 我已经阅读了很多例子,文档和问题,但是找不到我如何能够基本上删除一个"包#34;从数据流中处理它。 情况就是这样: - 从某个IP到IP和端口的数据流 - 流包含一些乱码,然后介于和之间的数据与分号分隔
到目前为止,我的尝试是让Socket监听端口并处理$ data var:
#!/usr/bin/perl
use IO::Socket::INET;
# auto-flush on socket
$| = 1;
# creating a listening socket
my $socket = new IO::Socket::INET (
LocalHost => '127.0.0.1',
LocalPort => '7070',
Proto => 'tcp',
Listen => 5,
Reuse => 1
);
die "cannot create socket $!\n" unless $socket;
print "server waiting for client connection on port 7070 \n";
while(1)
{
# waiting for a new client connection
my $client_socket = $socket->accept();
# get information about a newly connected client
my $client_address = $client_socket->peerhost();
my $client_port = $client_socket->peerport();
print "connection from $client_address:$client_port\n";
# read up to 1024 characters from the connected client
my $data = "";
$client_socket->recv($data, 1024);
print "received data: $data\n";
@data_array = split(/;/,$data);
foreach (@data_array) {
print "$_\n";
}
# write response data to the connected client
$data = "ok";
$client_socket->send($data);
# notify client that response has been sent
shutdown($client_socket, 1);
}
$socket->close();
这有效,但据我所知,这会将整个流放到最大尺寸然后处理。
我的问题: 如何识别我需要的部分(开始 - 结束),处理然后继续下一部分?
答案 0 :(得分:3)
我从未理解为什么人们使用recv
从流套接字中读取。
通常,阅读循环如下所示:
my $buf = '';
while (1) {
my $rv = sysread($socket, $buf, 64*1024, length($buf));
if (!defined($rv)) {
die("Can't read from socket: $!\n");
}
if (!$rv) {
die("Can't read from socket: Premature EOF\n") if length($buf);
last;
}
while (my $msg = defined(check_for_full_message_and_extract_it_from_buf($buf))) {
process_msg($msg);
}
}
(请记住,只要有一些数据,sysread就会返回,即使数据少于请求的数据。)
例如,Sentinel终止数据的内部循环如下所示:
while ($buf =~ s/^(.*)\n//) {
process_msg("$1");
}
例如,长度为前缀的块的内部循环如下所示:
while (1) {
last if length($buf) < 4;
my $len = unpack('N', $buf);
last if length($buf) < 4+$len;
substr($buf, 0, 4, '');
my $msg = substr($buf, 0, $len, '');
process_msg($msg);
}
如果你是特殊情况,你将从你想要忽略的开始$buf
中删除任何数据,直到你到达你感兴趣的部分,然后你开始提取这些项目你感兴趣的。这很模糊,但我对协议的工作只有模糊的描述。
答案 1 :(得分:0)
我通过使用原始代码并添加:
解决了这个问题{{1}}
我仍然需要实现我检查块读取是否具有下一条消息的一部分的部分,但我会想出来。 谢谢你的帮助!